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Nukleinsauremolekul, umfassend eine fur ein 
Hamocyanin kodierende Nukleinsauresequenz 

Die vorliegende Erfindung betrifft ein Nukleinsauremoiekul, umfassend eine fur ein Ha- 
mocyanin, eine Hamocyanin-Domane oder ein Fragment mit den immunologischen Ei- 
genschaften wenigstens einer Domane von Hamocyanin kodierende Nukleinsaurese- 
quenz, diese umfassende Konstrukte, die Nukleinsauresequenzen Oder die Konstrukte 
umfassende Wirtszellen, Verfahren zum Herstellen von Hamocyanin-Polypeptiden und 
rekombinante Hamocyanin-Polypeptide. 

Hamocyanin ist ein blaues Kupferprotein, das frei gelost im Blut zahlreicher Mollusken 
und Arthropoden auftritt und den Sauerstoff transportiert. Von den Mollusken enthalten 
die Cephalopoden, Chitonen, die meisten Gastropoden sowie einige Bivalvia Ha- 
mocyanin. Hamocyanin ist bei den Arthropoden typisch fur Arachniden, Xiphosuren, 
malakostrake Crustaceen und Scutigera. Zahlreiche Insektenarten weisen Proteine auf, 
die sich von Hamocyanin ableiten. Hamocyanine liegen extrazellular vor und flottieren in 
_ der Hamolymphe. 

Wahrend das Arthropoden-Hamocyanin bei elektronenmikroskopischer Untersuchung 
einen Durchmesser von maximal 25 nm hat und eine Untereinheit ein Molekulargewicht 
von 75.000 Da aufweist, sind Molluskencyanine viel gro(ier. So hat z.B. das Hamocya- 
nin von Megathura einen Durchmesser von 35 nm und ist aus 2 Untereinheiten zusam- 
mengesetzt. Jede Untereinheit hat ein Molekulargewicht von ca. 400.000 Da und ist in 
acht sauerstoffbindende Domanen aufgeteilt, die jeweils ein Molekulargewicht von ca. 
50.000 Da haben. Die Domanen unterscheiden sich immunologisch. Diese Domanen 
konnen durch limltierte Proteolyse aus der Untereinheit freigesetzt werden. 

Das im Elektronenmikroskop sichtbare Hamocyanin der Gastropoden hat ein Molekular- 
gewicht von ca. 8 Mio. Da und ist ein Di-Dekamer. Im Gegensatz hierzu ist das Ha- 
mocyanin der Cephalopoden als isoliertes Dekamer angeordnet, das sich auch in der 
Quartarstruktur deutlich vom Hamocyanin der Gastropoden unterscheidet. 



Von besonderem immunologischen Interesse ist das Hamocyanin der kalifornischen 
Schlussellochschnecke Megathura crenulata, einer „Keyhole Limpet" . Das Hamocyanin 
wird deshalb auch als Keyhole Limpet Hemocyanin (KLH) bezeichnet. Hamocyanine 
sind sehr starke Antigene. Die Immunisierung eines Vertebraten fuhrt zu einer bisher 
wenig verstandenen, unspezifischen Aktivierung des Immunsystems. Durch die allge- 
meine Aktivierung des Immunsystems ist es dann mdglich, auch eine Immunreaktion 
gegenuber anderen, bisher tolerierten Fremdstrukturen zu erreichen. KL H w i rd vor a lle m 
als Hapten-TrSger venA^endet. urn so die Bildung von AntikcJrpern gegen das Hapten zu 
erreichen. 



Neben Megathura crenulata gehort auch das Seeohr Haliotis tuberculata zur im Hinblick 
auf die Evolution relativ alten Gruppe der Archaegastropoda. Es ist bekannt, da(5 auch 
Haliotis Hamocyanin produziert. 




KLH ist ein Gemisch aus zwei unterschiedlichen Hamocyaninen, die als KLH1 und KLH2 
bezeichnet werden. Die Untereinheit des KLH1 ist ein 390 kDa Polypeptid, das aus acht 
globularen Domanen besteht, die entsprechend ihrer Reihenfolge in der Untereinheit mit 
1 a bis 1 h bezeichnet werden. KLH2 hingegen weist ein Molekulargewicht von 350 kDa 
auf und enthSit nach neuesten Daten ebenfalls 8 Domanen, die als 2 a bis 2 h bezeich- 
net werden. In vivo bildet jede Art von Untereinheit Homo-Oligomere, wohingegen He- 
tero-Oiigomere nicht beobachtet wurden. 

Durch limitierte Proteolyse und gekreuzte Immunelektrophorese der Untereinheit von 
KLH1 und KLH2 wurden amino-, interne und carboxy-terminale DomSnen erhalten, de- 
ren amino-terminale Sequenz bestimmt wurde (Sohngen et al., Eur. J. Biochem. 248 
(1997), 602-614; Gebauer et al., Zoology 98(1994), 51-68). Die erhaltenen Sequenzen 
eriauben jedoch nicht den Entwurf sequenzspezifischer Primer und/oder Sonden, die fur 
eine Hybridisierung mit genomischer DNA Erfolg versprechen. Obwohl beide KLH- 
Typen seit 1991 bzw. 1994 bekannt sind, konnte daher bisher keine Primarstruktur auf- 
geklart werden. 
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Auf DNA-Ebene ist bisher in bezug auf Mollusken nur die cDNA-Sequenz der Ha- 
mocyanin-Untereinheit aus dem Cephalopoden Octopus dofleini bekannt (Miller at al., J. 
Mol, Biol. 278 (1998). 827-842). Octopus dofleini ist phylogenetisch von den Archae- 
gastropoden sehr welt entfernt. Eine Hannocyanin-Gensequenz aus Mollusken ist bisher 
uberhaupt nicht bekannt. 



Wie v o n Mille r et al. sup r a, beschrieben, ist es sowoh l schwierig, eine einzig e funktion e l - 

le Domane (Funktionelle Einheit = Domane; auch Junktlonelle Domane" genannt) zu 
isolieren als auch Gewebe zu erhalten, das zur Aufreinigung von nnRNA fur die cDNA- 

^1^^ Sequenzierung geeignet ist. 

Bei der Analyse des Hamocyanins aus Megathura crenulata besteht eine weitere 
Schwierigkeit darin, dali die Versuchstiere ein Alter von 4 bis 8 Jahren erreicht haben 
mussen, urn ihnen erstmals Hamolymphe entnehmen zu kdnnen. Nach Entnahme der 
Hamolymphe wird Hamocyanin bei diesen Tieren nicht nachproduziert. Bisher ist nicht 
bekannt. wie die Hamocyaninsynthese stimuliert werden konnte. Daruber hinaus ist die 
Zucht von Megathura auBerst aufwendig, da hierfur spezielle Strdmungsbecken erfor- 
derlich sind. 




Es ist daher eine Aufgabe der vorliegenden Erfindung. Mittel und Wege bereitzustellen, 
um Hamocyanin und/oder Domanen davon in ausreichender Menge und kostengunstig 
produzieren zu konnen. Dies umfaBt die v^eitere Aufgabe, ein Verfahren anzugeben, mit 
dem dieses Hamocyanin hergestellt werden kann. 

Diese Aufgabe wird erfindungsgemaS geldst durch ein Nukleinsaure-Molekul, umfas- 
send eine fur ein Hamocyanin, eine Hamocyanin-Domane Oder ein funktionelles Frag- 
ment davon mit den immunologischen Eigenschaften wenigstens einer Domane eines 
Hamocyanins kodierende Nukleinsauresequenz. wobei die Nukleinsauresequenz aus- 
gewahlt ist aus 



(a) der Gruppe der nachfolgend angegebenen DNA-Sequenzen bzw. der ihnen ent- 
sprechenden RNA-Sequenzen: 
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in SEQ ID N0:1 (HtH1 Domane b), 
SEQ ID NO:2 (HtH1 Domane c). 
SEQ ID NO:3 (HtH1 Domane d). 
SEQ ID NO:4 (HtH1 DomSne e). 
SEQ ID N0:5 (HtH1 DomSne f), 
SEQ ID NO:6 (HtH1 Domane g), 

GEQ ID N0:7 ( H tHI Domane h). 

SEQ ID NO:8 (partielle HtH2 Domane b), 
SEQ ID N0:9 (HtH2 Domane c), 
SEQ ID NO: 10 (HtH2 DomSne d), 
SEQ ID N0:1 1 (HtH2 Domane e), 
SEQ ID N0:12 (HtH2 Donpane f), 
SEQ ID N0:13 (HtH2 Domane g), 
SEQ ID NO:14 (HtH2 DomSne h), 
SEQ ID N0:15 (partielle KLH1 DomSne c), 
SEQ ID N0:16 (KLH1 Domane d), 
SEQ ID NO: 17 (partielle KLH1 DomSne e), 
SEQ ID NO:18 (KLH2 DomSne b), 
SEQ ID NO;19 (KLH2 DomSne c), 

• (b) NukleinsSuresequenzen, die mit dem Gegenstrang einer Nukleinsauresequenz 
nach (a) hybridisieren und fCir ein Polypeptid kodieren, das die immunologischen Ei- 
genschaften wenigstens einer Domane eines HSmocyanins aufweist; 

(c) NukleinsSuresequenzen, die aufgrund des genetischen Codes zu den unter (a) und 
(b) definierten DNA-Sequenzen degeneriert sind und fCir ein Polypeptid kodieren, 
das die immunologischen Eigenschaften wenigstens einer Domane eines HS- 
mocyanins aufweist; 

(d) Nukleinsauresequenzen, die mit einer der unter (a) bis (c) angegebenen Nuklein- 
sauresequenzen liybridisieren und deren Gegenstrang fur ein Polypeptid kodiert, 




das die immunologischen Eigenschaften wenigstens etner Domane eines Ha- 
mocyanins aufweist; 

(e) Nukleinsauresequenzen, die wenigstens 60 % homolog zu einer der unter (a) ange- 
gebenen Nukleinsauresequenzen sind; 

{f) — Varianton dor unter (a) bis (o) ang e geb e n e n S e qu e nzen, wob e i die Varianten Addi- 
tionen, Deletionen, Insertionen Oder Inversionen aufweisen und fur ein Polypeptid 
kodieren, das die immunologischen Eigenschaften wenigstens einer Domane von 
Hamocyanin aufweist; und 

(g) Kombinationen mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen. 

Im nachfolgenden werden einige Begriffe naher erlautert, urn klarzustellen, wie sie im 
Zusammenhang der vorliegenden Anmeldung verstanden werden sollen. 

Der Begriff "Hamocyanin", so, wie er nachfolgend in der Beschreibung venA^endet wird, 

umfaBt vollstandiges Hamocyanin, Hamocyanin-Domanen und/oder Fragmente, Ha- 

mocyanin-Mutanten und Fusionsproteine. in bezug auf die Fusionsproteine sind insbe- 
sondere solche umfaBt, bei denen die Fusion Hamocyanin und Antigene umfafJt. 

Jnter,.Domanen" werden funktionelle Teilsequenzen der Hamocyanin-Untereinheiten 
verstanden, die beispieisweise durch limitierte Proteolyse voneinander abgetrennt wer- 
den konnen. Weiterhin konnen sie unterschiedliche immunologische Eigenschaften 
aufweisen. 

Mit den .Jmmunologischen Eigenschaften wenigstens einer Domane von Hamocyanin" 
ist die Eigenschaft eines Polypeptids gemeint, in gleicher Weise wie wenigstens eine 
Domane von Hamocyanin eine immunologische Antwort des Empfangers zu induzieren, 
der mit dem Polypeptid immunisiert wird. Unter Jmmunologischer Antwort" werden hier 
T- und/oder B-Zell-Antworten gegen Hamocyanin-Epitope verstanden, wie beispieiswei- 
se eine Antikorperproduktion. Die immunologische Reaktion kann beispieisweise beob- 
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achtet werden durch Immunisieren eines Saugers, wie z.B. einer Maus, einer Ratte Oder 
eines Kaninchens mit dem entsprechenden Polypeptid und Vergleich der Immunantwort 
auf das zur Immunisierung verwendete Polypeptid mit der Immunantwort auf naturliche 
Hamocyanine. 



Der Begriff "Antigen" umfafit erfindungsgema(i sowohl Haptene, als auch schwache und 

Starke Ant i gene. Haptene sind dadurch charakter i siert, daf^ s ie Su bs t a nzen niedriger 

Molekulmasse (kleiner als 4000 Da) sind, jedoch ohne Kopplung an ein Tragermolekul 
nicht in der Lage sind, eine immunologische Reaktion auszulosen. Schwache Antigene 
sind Substanzen, die selbst bereits eine immunologische Reaktion auslosen konnen, 
deren Potential, eine immunologische Reaktion auslosen zu konnen, durch Kopplung 
mit einem Trager-Molekul auf Protein- und/oder DNA-Ebene, noch erhoht werden kann. 




"His-Tag" bedeutet eine Sequenz von wenigstens 6 Histidin-Aminosauren, die durch 
entsprechende Klonierung und Fusion mit einer exprimierbaren Sequenz zu einem Fu- 
sionsprotein mit wenigstens 6 His-Resten am NH2-Terminus fuhrt, das leicht durch 
Komplexierung mit einer Ni^^-Saule aufgereinigt werden kann. 

"Klonierung" soil alle im Stand der Technik bekannten Klonierungsmethoden umfassen, 
die hier zum Einsatz kommen kOnnten. die jedoch nicht alle im einzelnen beschrieben 
werden, well sie zum selbstverstandlichen Handwerkszeug des Fachmanns gehOren. 

Unter "rekombinanter Expression in einer geeigneten Wirtszelle" soilen alle im Stand der 
Technik bekannten Expressionsmethoden in bekannten Expressionssystemen verstan- 
den werden, die hier zum Einsatz kommen konnten, jedoch nicht alle im einzelnen be- 
schrieben werden, weil sie zum selbstverstandlichen Handwerkszeug des Fachmanns 
gehoren. 



Die im erfindungsgemaden Nukleinsauremolekul enthaltene Nukleinsauresequenz kann 
genomische DNA, cDNA Oder synthetische DNA sein, wobei unter synthetischen DNA- 
Sequenzen auch solche verstanden werden, die modifizierte Internukleosid-Bindungen 
enthalten. Weiter kann es sich bei den Nukleinsauresequenzen um RNA-Sequenzen 



handeln, was z.B. fur die Expression mittels rekombinanter Vektorsysteme erforderlich 
sein kann. Die Nukleinsauresequenzen gemSR (b) sind beisplelsweise erhaltlich durch 
Verwenden einer nachweisbar markierten Sonde, die einer der unter (a) angegebenen 
Sequenzen Oder einem Fragment bzw. deren Gegenstrang entspricht, zum Screening 
von cDNA-/genomischen DNA-Bibliotheken aus Mollusken oder Arthropoden. Die der 
cDNA-Bibliothek zugrundeliegende mRNA ist vorzugsweise aus Mollusken-Geweben zu 

e rh al t e n, d ie H a mooyanin b e sond e rs stark e xprimi e ren, wis z.B. Mante l- Gewebe aus 

Gastropoden und Branchialdrusengewebe aus Cephalopoden. 

^^fl^Die Identifizierung positiver cDNA-/genomischer DNA-Klone erfoigt gemafl Standardver- 
^^^^fahren. Vgl. Maniatis et al., Molecular Cloning (1989) Cold Spring Harbor Laboratory 
Press. 

In einer bevorzugten Ausfuhrungsform wird die unter (b) Oder (d) angegebene Hybridi- 
sierung unter stringenten Bedingungen durchgefuhrt. Stringente Hybridisierungsbedin- 
gungen sind z.B. 68X Qber Nacht in 0,5 x SSC; 1% Blockierungsreagenz (Boehringer 
Mannheim); 0,1 % Natriumlaurylsarcosinat und nachfolgendem Waschen mit 2 x SSC; 
0,1 % SDS. 

In einer bevorzugten Ausfuhrungsform werden Nukleinsauresequenzen bereitgestellt, 

•die wenigstens 60 % homolog zu einer der unter (a) angegebenen Nukleinsaurese- 
quenzen sind. Bevorzugt sind die Nukleinsauresequenzen wenigstens 80 % homolog zu 
einer der unter (a) angegebenen Nukleinsauresequenzen. Besonders bevorzugt sind 
die Nukleinsauresequenzen wenigstens 90 % homolog zu einer der unter (a) angege- 
benen Nukleinsauresequenzen. Insbesondere sind die Nukleinsauresequenzen wenig- 
stens 95 % homolog zu einer der unter (a) angegebenen Nukleinsauresequenzen. 

ErfindungsgemalS bedeutet der Ausdruck „Homologie" Homologie auf DNA-Ebene, die 
gemafi bekannter Verfahren, z.B. der computergestutzten Sequenzvergleiche (Basic lo- 
cal alignment search tool, S.F. Altschul et al., J. Mol. Biol. 215 (1990), 403-410) be- 
stimmt werden kann. 
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In einer bevorzugten Ausfuhrungsform ist die erfindungsgemafie DNA-Sequenz eine 
Kombination mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen, die durch 
dem Fachmann bekannte Fusion und gegebenenfalls Klonierung erhalten werden kon- 
nen. Diese Kombination sind von besonderem Interesse, da sie besonders immunogen 
sind. Insbesondere sind Kombinationen bevorzugt, die mehrere oder alle Domanen in 
der in der Untereinheit naturiicherweise vorkommenden Reihenfolge (a bis h) aufweisen. 

B es onders b e vorzugt sind dab e i Ausfuhrungsform e n, in denen die fur d i e Domanen 

kodierenden Nukleinsauresequenzen direkt im Raster aneinandergekoppelt sind. 

^^^^Weiterhin werden Konstrukte bereitgestellt, die die erfindungsgemafSen Nukleinsaure- 
^^^molekule umfassen. In einer bevorzugten Ausfuhrungsform umfadt das erfindungsge- 
rnaRe Konstrukt einen zur Expression geeigneten Promotor, wobei die Nukleinsaurese- 
quenz unter der Kontrolle des Promotors steht. Die Wahl des Promotors hangt vom zur 
Expression venA^endeten Expressionssystem ab. Generell sind konstitutive Promotoren 
bevorzugt, jedoch sind auch induzierbare Promotoren wie z.B. der Metallothionein- 
Promotor moglich. 

In einer weiterhin bevorzugten Ausfuhrungsform umfalit das Konstrukt ferner eine Anti- 
gen-kodierende Nukleinsauresequenz, die direkt mit der erfindungsgemafJen Ha- 
mocyanin-Nukleinsaure verbunden ist. Die Antigen-kodierende Sequenz kann sowohl 

•5' als auch 3' relativ zur Hamocyanin-Sequenz Oder auch an beiden Enden gelegen 
bein. Sie schlieBt im gleichen Leseraster entweder unmittelbar an die HSmocyanin- 
Sequenz an Oder ist durch einen Nukleinsaure-Linker unter Wahrung des Leserasters 
mit ihr verbunden. Durch die Fusion der Antigen-kodierenden Sequenz mit der Ha- 
mocyanin-Sequenz ist die Bildung eines Fusionsproteins beabsichtigt. in dem die Anti- 
gen-kodierende Sequenz kovalent mit der Hamocyanin-Sequenz verbunden ist. Das er- 
findungsgemalie Antigen ist hierbei ein medizinisch relevantes Antigen, das beispiels- 
weise ausgewahit ist aus: Tumorantigenen, Virusantigenen und Antigenen bakterieller 
Oder parasitarer Pathogene. Tumorantigene konnen hierbei beispielsweise Rb und p53 
sein. Vorzugsweise stammen die Virusantigene aus immunologisch reievanten Viren, 
wie z.B. Influenza-Virus, Hepatitis-Virus und HIV. Pathogenantigene sind unter anderem 
solche aus Saugerpathogenen, insbesondere humanpathogenen Organismen, wie z.B. 



Plasmodium. Bakterielle Antigene konnen z.B. von Klebsiella, Pseudomonas, E. coll. 
Vibrio cholerae, Chlamydia, Streptococcen oder Staphylococcen stammen. 



In einer weiteren bevorzugten Ausfuhrungsform umfalit das Konstrukt ferner wenigstens 
ein Teil eines Vektors, insbesondere regulatorische Regionen, wobei der Vektor ausge- 
wahlt ist aus : Bacteriophagen wie ?L-Derivaten, Adenoviren, Vacciniaviren, Baculoviren, 
" SV40-Vir ef ] und Ret r ovi r en, vu f zuysweise MuMuLV (Moloney Murine Leukemia Virus). — 

Ferner ist ein Konstrukt bevorzugt, das zusatzlich eine His-Tag-kodierende DNA- 
^I^^^Sequenz umfaBt, die bei Expression des Konstrukts zur Bildung eines Fusionsproteins 
^^^mit einem His-Tag am NH2-Termjnus des Hamocyanins fuhrt, welches die Aufreinigung 
des Proteins an einer Nickel-Saule durch Chelat-Bildung erieichtert. 



Ferner stellt die Erfindung Wirtszellen bereit, die das Konstrukt enthalten und die zur 
Expression des Konstruktes geeignet sind. Im Stand der Technik sind zahlreiche pro- 
karyontische und eukaryontiscfie Expressionssysteme bekannt, wobei die Wirtszellen 
beispielsweise ausgewalilt sind aus prokaryontischen Zellen wie E. coli oder B, subtilis, 
aus eukaryontiscfwrZellerrwie^Hefeze 

Zellen, COS-Zellen Oder HeLa-Zellen, sowie Derivaten davon. Im Stand der Technik 
sind beispielsweise bestimmte CHO-Produktionslinien bekannt, deren Glykosyiierungs- 
muster im Vergleich zu CHO-Zellen verSndert sind. Die durch die Verwendung Glykosy- 
(ierungs-defizienter Oder Giykosylierungs-verringerter Wirtszellen erhaltenen Hamocya- 
nine verfCigen moglicherweise uber zusatzliche Epitope, die bei voilstandiger Glykosylie- 
rung ansonsten dem Immunsystem des Empfangers nicht zuganglich sind, so dafi Ha- 
mocyanine mit verringerter Glykosylierung unter Umstanden eine erhohte Immunoge- 
nizitat aufweisen. 



Gegenstand der vorliegenden Erfindung ist weiter ein Verfahren zum Herstelien eines 
Hamocyanin-Polypeptids. Dazu wird das erfindungsgemafie Nukleinsauremolekul 
und/oder das Konstrukt in einer geeigneten Wirtszelle exprimiert und das Protein aus 
der Wirtszelle Oder dem Medium mittels ubiicher Verfahren isoliert. 
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Dem Fachmann sind zahlreiche Verfahren zur Expression von DNA-Sequenzen be- 
kannt; vergleiche Recombinant Gene Expression Protocols in Methods in Molecular 
Biology. Band 62, Hunnana Press Totowa New Jersey (1995). Die Expression kann so- 
wohl konstitutiv ais auch induzjerbar sein, wobel Induktoren wie beispielsweise IPTG und 
Zn^"" dem Fachmann bekannt sind. Das hergestellte Hamocyanins kann, falls ein His- 
Tag an den NHz-Terminus des Hamocyanin fusioniert wurde, durch Chelat-Bildung an 

einer Nickel - Sau l e aufgereinigt werden. Verfahren zum Aufre i n i gen von Hamocya ni n , 

insbesondere KLH, finden sich in Harris et al., Micron 26 (1995), 201-212. Vorzugsweise 
wtrd das Hamocyanin durch lonenaustausch-Chromatographie und/oder Gelfiitrations- 

1^^^ chromatographie aufgereinigt. Die Durchfuhrung dieser Mafinahmen ist dem Fachmann 

^^H^ bekannt. 

In einer weiteren bevorzugten AusfCihrungsform wird das erfindungsgemali hergestellte 
Hamocyanin modifiziert. Die Modifikationen umfassen hierbei die Di-, Oligo- und Poly- 
merisierung des monomeren Ausgangsprodukts beispielsweise durch Quervernetzung, 
z.B. durch DIcyclohexylcarbodiimid oder Pegylierung Oder Assoziation (self assembly). 
Die somit hergestellten Di-, Oligo- u nd Po lym ere konnen vo neinander durch Gelfiltration 
abgetrennt werden. insbesondere beabsichtigt ist die Bildung von Dekameren, Dideka- 
meren oder Multi-Dekameren. Weitere Modifikationen umfassen Seitenketten- 
Modifikationen, beispielsweise von s-Amino-Lysin-Resten des Hamocyanins, oder Ami- 

•no- bzw. Carboxy-terminale Modifikationen. Besonders bevorzugt ist die Modifikation 
des HSmocyanins durch kovalente Bindung an ein Antigen, wobei das Antigen stOchio- 
metrisch oder nicht-stochiometrisch mit dem Hamocyanin umgesetzt sein kann. Das An- 
tigen ist vorzugsweise ausgewahit aus Tumorantigenen. Virusantigenen und Pathoge- 
nenantigenen wie oben ausgefuhrt. Weitere Modifikationen umfassen posttranslationale 
Ereignisse, z.B. die Glykosylierung oder die partielle oder vollstandige Deglykosylierung 
des Proteins. 



In einer bevorzugten AusfCihrungsform ist das erhaltene Hamocyanin bei rekombinanter 
Expression in Prokaryonten oder Glykosylierungs-defizienten Eukaryonten nicht- 
glykosyliert. Ebenfalls in Betracht gezogen wird erfindungsgemafJ Hamocyanin, das 
durch rekombinante Expression in zur Glykosylierung fahigen Eukaryonten wie Hefezel- 
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len, Insektenzellen Oder SSugerzellen, wie CHO-Zellen Oder HeLa-Zellen, glykosyliert 
ist. 

In einer weiteren AusfOhrungsform werden HSmocyanin-Polypeptide zur Verfugung ge- 
stellt, die eine AminosSuresequenz umfassen, wobei die Aminosauresequenz von einer 
Oder mehreren der erfindungsgemaflen Nukleinsauremolekule kodiert wird. 

Bevorzugt werden Hamocyanin-Polypeptide zur Verfugung gestellt, die wenigstens eine 
aus der foigenden Gruppe ausgewahlte Aminosauresequenz umfassen; 




SEQ ID NO:20 (HtH1 Domane b), 
SEQ ID N0:21 (HtHI Domane c), 
SEQ ID NO:22 (HtHI DomSne d). 
SEQ ID NO:23 (HtH1 Domane e). 
SEQ ID NO:24 (HtHI Domane f), 
SEQ ID NO:25 (HtH1 DomSne g). 
SEQ ID NO:26 (HtH1 Domane h), 
SEQ ID NO:27 (partielle HtH2 DomSne b), 
SEQ ID NO:28 (HtH2 Domane c). 
SEQ ID NO:29 (HtH2 DomSne d), 
SEQ ID NO:30 (HtH2 DomSne e). 
SEQ ID N0:31 (HtH2 Domane f). 
SEQ ID NO:32 (HtH2 D6mane g). 
SEQ ID NO:33 (HtH2 Domane h). 
SEQ ID NO:34 (partielle KLH1 Domane c), 
SEQ ID NO:35 (KLH1 DomSne d), 
SEQ ID NO:36 (partielle KLH1 Domane e), 
SEQ ID NO:37 (KLH2 Domane b). 
SEQ ID NO:38 (KLH2 Domane c). 

Oder ein Fragment einer dieser Sequenzen, das die immunologischen Eigenschaften 
wenigstens einer Domane von Hamocyanin aufweist. 
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In einer weiteren Ausfuhrungsform stellt die Erfmdung Hamocyanin-Polypeptide, erhalt- 
lich durch das rekombinante Herstellungsverfahren Oder Modifikationen davon, bereit 

Bevorzugt sind Hamocyanin-Polypeptide, die jede der Sequenzen SEQ ID NO: 20, 21, 
22, 23, 24, 25, 26 umfassen, und Hamocyanin-Polypeptide, die die Sequenzen SEQ ID 
NO: 27, 28, 29, 30, 31, 32, 33 umfassen. Besonders bevorzugt handelt es sich bei die- 
son Hamocvan i n-Polyp e pt i d e n um I lamocvanin 1 Oder 2 aus f laliotis tuberculata . 

Insbesondere bevorzugt ist Hamocyanin 1 aus Haliotis tuberculata, das ein scheinbares 




Molekulargewicht von 370 kDa in SDS-PAGE unter reduzierenden Bedingungen auf- 
weist. Weiterhin ist insbesondere Hamocyanin 2 aus Haliotis tuberculata bevorzugt, das 



ein scheinbares Molekulargewicht von 370 kDa in SDS-PAGE PAGE unter reduzieren- 
den Bedingungen aufweist. Die Hamocyanine sind durch das in den Beispielen be- 
schriebene selektive Dissoziationsverfahren aus Gesamt-Hamocyanin aus Haliotis tu- 
berculata erhaltlich. 



Weiterhin bevorzugt sind_H.arooj:y.aoiOrPolyp_eptide^^^^ 

NO: 34, 35 und 36 umfassen, und Hamocyanin-Polypeptide, die jede der Sequenzen 
SEQ ID NO: 37 und 38 umfassen. 

•Besonders bevorzugt handelt es sich bei diesen Hamocyanin-Polypeptiden um voll- 
standiges Hamocyanin 1 (KLH1) Oder 2 (KLH2) aus Meqathura crenulata . 

Weiterhin wird nicht-glykosyliertes und glykosyliertes Hamocyanin-Polypeptid, erhaltlich 
durch Expression in zur Glykosylierung fahigen bzw. unfahigen Wirtszellen, bereitge- 
stellt. Je nach vorgesehener Verwendung des Hamocyanin-Polypeptids kann das Gly- 
kosylierungsmuster von Hefe, inbesondere methylotropher Hefe, von COS- Oder HeLa- 
Zellen bevorzugt sein. 



Die Erfindung betrifft weiterhin pharmazeutische Zusammensetzungen, die die erfin- 
dungsgemafSen Nukleinsauremolekule und physiologisch vertragliche Zusatzstoffe, die 
im Stand der Technik bekannt sind, enthalten. Vorzugsweise werden die pharmazeuti- 




schen Zusammensetzungen zur unspezifischen Immunstimulierung in Form einer 
Gentherapie eingesetzt, wobei nach Transformation mit einem geeigneten Vektor Ha- 
mocyanin-Polypeptide exprimiert werden und zur Antigenisierung des Gewebes dienen. 



Insbesondere sieht die vorliegende Erfindung die Verwendung eines erfindungsgema- 
(len Nukleinsauremolekuls, das mit einer Antigen-kodierenden DNA-Sequenz verbun- 

don ist zur GpozifiGchon Immunisi e rung g e g o n d ie s e s Antig e n vor Die Immunisierung 

beruht hierbei, ohne an diese Theorie gebunden zu sein, auf der unspezifischen Stim- 
mulierung des Immunsystems durch Hamocyanin-Polypeptid-Epitope und die weiterge- 

^l^^^hende spezifische Immunisierung durch Erkennung von Antigen-Epitopen durch das 
Immunsystem. 



Eine seiche Immunisierung ist besonders wertvoli im Hinblick auf Pathogen-Antigene, 
ganz besonders aber im Hinblick auf Tumorantigene. Die Anwendbarkeit der erfin- 
dungsgemaflen pharmazeutischen Zusammensetzung zur Behandlung von Tumorer- 
krankungen ergibt sich auch aus der Kreuzreaktivitat der gebildeten Hamocyanin- 
spezifischen Antikorper mit Kohlenhydratresten, die auf der Oberflache von Tumoren 
auftreterrrwie^BrctemrThomsen-Prfedenreich-Antr^ — 
manen Tumoren wie Epithelialkarzinomen, Ovarialkarzinom, Kolonrektalkarzinom, 
Mammakarzinom, Bronchialkarzinom und Harnblasenkarzinom auftritt. 

Iweiterhin konnen die erfindungsgemalien pharmazeutischen Zusammensetzungen 
zum Behandein von parasitSren Erkrankungen wie Schistosomiasis und fur die Kokain- 
Milibrauchsvorsorge eingesetzt werden. 



Als weitere Ausfuhrungsform der vorliegenden Erfindung werden pharmazeutische Zu- 
sammensetzungen zur Verfugung gestellt, die ein erfindungsgemaRes Hamocyanin- 
Polypeptid in Verbindung mit einem Oder mehreren physiologisch vertraglichen Zu- 
satzmitteln enthalten. Wie oben bereits enA^ahnt, kann ein solches Hamocyanin-Poly- 
peptid aus einer vollstandigen Hamocyanin-Untereinheit, aus einer Oder mehreren Do- 
manen sowie aus einem Oder mehreren Fragmenten solcher Domanen bestehen, vor- 
ausgesetzt, da(J diese Fragmente noch die immunologischen Eigenschaften wenigstens 
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einer Domane eines Hamocyanins aufweist. Eine solche pharmazeutische Zusammen- 
setzung eignet sich durch die entweder unspezifische Immunstimulation, die allein auf 
das Hamocyanin zuruckzufuhren ist. Oder durch die spezifische Immunreaktion auf mit 
dam Hamocyanin assoziierte Antigens z.B. als Antiparasitenmittel, Antivirusmittel Oder 
Antitumormittel. So kann sie z.B. zum Behandein von Schistosomiasis, Epithelialkarzi- 
nomen, Ovarialkarzinom, Kolonrektalkarzinom, Mammakarzinom, Bronchialkarzinom 
und H arnblQs e nkafz i nomcn o i ngcsotzt warden, cign o t sich jedoch auch zum Behandein 
von Bluthochdruck. Die Behandlung von Bluthochdruck wird erreicht, indem eine Immu- 
nisierung mit Hilfe von erfindungsgemalSen Hamocyanin-p-adrenergen-Rezeptorpeptid- 
Konstrukten und/oder Fusionsproteinen durchgefuhrt wird. 



In einer weiteren Ausfuhrungsform werden die erfindungsgemaften pharmazeutischen 
Zusammensetzungen als Impfstoffe verwendet. Sie konnen somit einen wertvollen Bei- 
trag zur Prophylaxe von durch bekannte Pathogens verursachte Erkrankungen ieisten. 
Dies gilt insbesondere fur phannazeutische Zusammensetzungen. in denen ein Ha- 
mocyanin-Polypeptid an ein Virus, Virusbestandteil, abgetStete Bakterien, Bakterienbe- 
standtejie, in sbesondere Oberflachenprotein e aus Virus- Oder BakterienhCillen, DNA, 
DNA-Bestandteile, anorganische oder organische Molekule, z.B. Kohlenhydrate, Pepti- 
de und/oder Glykoproteine gebunden ist. 




GemaiS einer weiteren bevorzugten Ausfuhrungsform wird die erfindungsgemafJe phar- 
mazeutische Zusammensetzung zur Kokain-Milibrauchsvorsorge verwendet. 



Zur Applikation sowohi der erfindungsgemaBen Nukleinsauremolekule als auch der 
Hamocyanin-Polypeptide eignen sich insbesondere Liposomen. Dementsprechend 
umfafit die vorliegende Erfindung Liposomen, die ein erfindungsgemafies Nukleinsau- 
remolekul, ein erfindungsgemafies Konstrukt Oder ein erfindungsgemaBes Hamocyanin- 
Polypeptid umfassen. 



Dem Fachmann sind verschiedene Verfahren zum Herstellen von Liposomen, die fur 
pharmazeutische Zwecke verwendbar sind, bekannt. Die Selektivitat der die erfindungs- 
gemafJen Nukleinsauremolekule oder Hamocyanin-Polypeptide enthaltenden Liposo- 




men kann durch den zusatzlichen Einbau von Zellerkennungsmolekulen in die Liposo- 
men erhoht werden. die selektiv an Zieizellen binden. Hierzu eignen sich insbesondere 
Rezeptorliganden, die an Rezeptoren der Zieizellen binden, Oder, besonders im Fall von 
Tumoren, Antikorper, die gegen Oberflachenantigene der jeweils anvisierten Zieizellen 
gerichtet sind. 

Die erfindungsgemaRen I lamocyanin-Polypeptide sind auflcrdom als Trogormolokul fur 
Arzneistoffe, wie z. B. Cytostatika, vorgesehen. Die VergrofJerung des Molekulargewich- 
tes verlangert die physiologische Halbwertszeit der Arzneistoffe erheblich, da der Verlust 
^1^^^ durch Ultrafiltration in der Niere deutlich verringert ist. 

Die Zubereitung der Impfstoffe erfolgt nach dem Fachmann bekannten Verfahren; in ei- 
nigen Ausfuhrungsformen ist die zusatzliche Verwendung von Adjuvanzien wie z. B. 
Freundsches Adjuvanz Oder Polysacchariden vorgesehen. 

Die Erfindung stellt ferner Antikorper bereit, die spezifisch mit dem erfindungsgemSIien 
Hamocyanin-Polypeptid reagieren und erhaltlich sind durch Immunisieren eines Ver- 
suchstieres mit einem Hamocyanin-Polypeptid. Polyklonale Antikorper konnen durch 
Immunisieren beispielsweise von Kaninchen und anschliefJendem Gewinnen von Anti- 
seren erhalten werden. Monoklonale Antikorper konnen gemafi Standardverfahren 
durch Immunisieren von z.B. Mausen, Gewinnen und Immortalisieren der Milzzellen und 
Klonieren der Hybridome. die fur Hamocyanin spezifische Antikorper produzieren, erhal- 
ten werden. 

Weiterhin wird ein Screening-Verfahren zum Identifizieren von Tumor-spezifischer DNA 
in einerZelle bereitgestellt, das die Schritte umfafSt: 

a) das Inkontaktbringen zellularer DNA und/oder zellularen Proteins mit einer Sonde 
umfassend das erfindungsgemafie Nukleinsauremolekul und/oder den erfindungs- 
gemaften Antikorper und 

b) das Nachweisen der spezifischen Bindung. 



r 



16 



Vorzugsweise ist der nachzuweisende Tumor ein Harnblasenkarzinom, Epithelialkarzi- 
nom, Ovarialkarzinom. Mammakarzinom, Bronchialkarzinom Oder Kolonrektalkarzinom. 

Es ist beabsichtigt. mit den nachfolgenden Figuren und Beispielen die Erfindung zu er- 
lautern. diese jedoch in keiner Weise einzuschranken. Dem Fachmann sind aufgnjnd 
Uei Beschreibung und de r Beis pi el e weitere Ausfuhrungsform e n zuganglich. die obcn 
falls umfaBt sind. 



1» 




Fig. 1 zeigt die Charakterisierung und Aufreinigung von Haliotis tuberculata 
Hamocyanin (HtH): 

(a) Elektronenmikroskopie von negativ gefarbtem Gesamt-HtH, das durch Ultrazen- 
trifugation von Zell-freier Hamolymphe aufgereinigt wurde; 

(b) SDS-Polyacryamid-Gelelektrophorese (7,5 % Polyacrylamid) von HtH1 im Ver- 
glelch zu KLH (MW 370 kDa); 

(c) Native Polyacrylamid-Gelektrophorese (5 % Polyacrylamid) der HtH- 
Unterei nheiten-Pra p aration. wobei die Anode am unteren Rand liegt; 

(d) Gekreuzte Immunelektrophorese der beiden HtH-Untereinheiten unter Verwen- 
dung von anti-HtH-Antikorpern aus Kanincfien; 

(e) Elektronenmikroskopie der verbleibenden HtHI-Dldekamere (weifie Pfeile) nach 
der selektiven Dissoziation von HtH2 (schwarze Pfeile); 

'(f) Elutionsprofil der Gelfiltrationschromatographie (Biogel A15m) in Gegenwart von 
Ammoniummolybdat/Polyethylenglykol-Losung (pH 5.9) nach der selektiven Dis- 
soziation von HtH2 in seine Untereineinheit und nachfolgender Anreicherung von 
Htm durch Ultrazentrifugation; 
(g) Native Polyacrylamid-Gelelektrophorese (6,5 % Polyacrylamid) von durch 

Gelchromatographie aufgereinigten HtH1- und HtH2-Uhtereinheiten im Vergieich 
zum Ausgangsmaterial; 
(h,i) Gekreuzte Immunelektrophorese von chromatographisch aufgereinigten HtH- 
Untereinheiten; und 
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(j,m) Gekreuzte Immunelektrophorese der aufgereinigten HtH-Untereinheiten unter 
Verwendung von anti-KLH-Antikorpern bus Kaninchen, die fur KLH! bzw. KLH2 
spezifisch sind. 

Fig. 2 zeigt die Untersuchung der Untereinheiten-Organisation von HtHI. wobei fur die 
Immunelektrophorese anti-HtHI-Antikorper aus Kaninchen verwendet wurden 
und d i e Anod e s i ch auf d e r l l nken Soitc bofand: 

(a) Gekreuzte Immunelelektrophorese nach limitierter Proteolyse von HtHI mit Hilfe 
von Elastase; 

4^^^ (b) SDS-Polyacrylamid-Gelelektrophorese (7,5 % Polyacrylamid) von Elastase- 
^^^V gespaltener HtH1-Untereinheit; 

(c,d,g-j,l,n.p) Gekreuzte Immunelektrophorese der Elastase-Spaltprodukte der HtH1- 
untereinheit; 

(e) Gekreuzte Immunelelektrophorese nach limitierter Proteolyse von HtHI mit Hilfe 
von V8 Protease; 

(f) SDS-Polyacrylamid-Gelelektrophorese (7,5 % Polyacrylamid) von V8 Protease- 
gespaltener HtH1-Untereinheit und 

(k.mvo) Gekreuzte4mmunelelektr0phoFese^aGh^limitierter-ProteoLyse-^^^ 

mit Hilfe der drei angegebenen Proteasen. 

Fig. 3 zeigt die Auftrennung von proteolytischen Spaltprodukten der Untereinheit HtHI 
mit Hilfe von HPLC. 

Fig. 4 zeigt die cDNA-Sequenz von HtHI in Verbindung mit der Intronstruktur. 

Fig. 5 zeigt die abgeleitete Primarstruktur von HtH1. 

Fig. 6 zeigt die cDNA-Sequenz von HtH2 in Verbindung mit der Intronstruktur. 

Fig. 7 zeigt die abgeleitete Primarstruktur von HtH2. 

Fig. 8 zeigt die cDNA-Sequenz von KLH1 in Verbindung mit der Intronstnjktur. 



* • • • • • 
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Fig. 9 zeigt die abgeleitete Primarstruktur von KLH1. 

Fig, 10 zeigt die cDNA-Sequenz von KLH2 in Verbindung mit der Intronstruktur. 
Fig. 11 zeigt die abgeleitete Primarstruktur von KLH2. 



BEISPIELE 

> 

1. Gewinnen der Hamolymphe und Isolieren von Hamocyanin 

Individuen des europaischen Seeohrs Haliotis tuberculata aus dem Bereich der fran- 
zosischen Atlantikkuste wurden von S.M.E.L (Blainville sur Mer, Frankreich) und der 
Firma Biosyn (Fellbach, Deutschland) bereitgestellt. Die Tiere wurden in einem 300 I 
Seewasser-Aquarium bei 17 C gehalten and"mit-Braunalgen-gefuttertr2ur Entnahme 
der Hamolymphe v^urden die Seeohren in einem verschlossenen Plastiksack auf Eis 
gestellt Nach einer Stunde waren gro(ie Volumina an Hamolymphe durch ihre Haut se- 
zerniert worden. Es stellte sich heraus, dafi das durch dieses Verfahren erhaitene Ha- 

• mocyanin identisch ist mit dem Hamocyanin, das durch Einschneiden einer Mulde in den 
Fuli heruntergekuhlter Meeresschnecken unter Verwendung einer Skalpellklinge ge- 
sammelt werden konnte. Die Blutzellen wurden von der Hamolymphe durch Zentrifuga- 
tion bei 800 g uber 30 min bei 4 C abgetrennt. Das gesamte Hamocyanin wurde sofort 
danach durch praparative Ultrazentrifugation bei 30000 g uber 4 Stunden bei 4 C se- 
dimentiert. Der Uberstand wurde verworfen und das blaue Hamocyanin-Pellet wurde 
uber Nacht in "Stabilisierungs-Puffer (0,05 M Tris, 5 mM CaCb, 5 mM MgCb, 0,15 M ' 
NaCI, 1 mM PMSF. pH 7.4) suspendiert und bei 4 C gelagert. 

Intaktes HtHI wurde unter Verwendung des von Harris et al., 1995, supra, beschriebe- 
nen Verfahrens aus dem gesamten HtH durch selektive DIssoziation von HtH2 in Am- 
moniummolybdat/Polyethylenglykol (1%/0,2%)-L6sung, pH 5.9 und nachfolgender Ultra- 




# 
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zentrifugation erhalten. Das entstandene, teilweise aufgereinigte HtH 1 -Pellet wurde auf- 
gelost und durch Gelfiltration auf einer Biogel A15m-Vorrichtung zur Homogenitat aufge- 
reinigt. Der letzte Schritt ergab geringe Mengen von aufgereinigtem HtH2. Natives HtH1 
und HtH2 wurde durch Dialyse gegen "Dissoziationspuffer" (0,13 M Glycin/NaOH, pH 
9,6) bei 4 C uber Nacht quantitativ in die Untereinheiten dissoziiert; die Gegenwart von 
EDTA war nicht erforderlich. 1 mM PMSF wurde bei jeder Stufe der Aufreinigung hinzu- 
gefugt. urn die Proteolyse zu hemmen. : 

2. Elektronenmikroskopie 

Konventionelles "negative staining" wurde mit dem Einzel-Tropfen-Verfahren (Harris und 
Home in Harris, J.R. (Herausgeber) Electron nnicroscopy in biology, (1991). IRL Press 
Oxford. S. 203-228) durchgefuhrt. Kohlenstofftrager-Filme wurde anfanglich uber 20 Se- 
kunden gluhentiaden, um sie hydrophil und fur das Protein adsorptiv zu machen. Man 
lalit die Proteinproben an den Kohlenstoffilmen uber 60 Sekunden adsorbieren. Sodann 
werden die Puffersaize durch sequentielles Waschen mit vier aufeinanderfolgenden 20 
^il Wassertropfen entfernt. Die Gitter werden schliefllich mit einem 20 y} Tropfen 5 % 
wafirigen Ammoniammoiybdatsrenthaltend^t^%-~TTehaloseip^ 
bei Raumtemperatur trocknen gelassen. Fur die elektronenmikroskopische Untersu- 
chung wird ein Zeiss EM 900 Transmlssionselektronenmikroskop verwendet. 

3. Polvacrvlamid-Gel-Elektrophorese und Immunelektrophorese 

SDS-Polyacrylamid-Gel-Elektrophorese (SDS-PAGE) wurde gemaU des Verfahrens von 
Laemmli (Nature 227 (1970), 670-685) durchgefuhrt. Zur nativen PAGE wurde ein alka- 
lisches System gemafi Mark! et al. (1979) J. Comp. Physiol. 133 B, 167-175 mit einem 
0,33 M Tris/Borat, pH 9,6 als Gelpuffer und 0,065 M Tris/Borat. pH 9,6 als Elektroden- 
puffer verwendet. Gekreuzte und "crossed-line" Immunelektrophorese (IE) wurden ge- 
maft Weeke (Scand. J. Immunol. 2 (1973), Suppi. 1, 47-56) bzw. Kroll (Scand. J. Immu- 
nol. 2. Suppl. 1 (1973), 79-81) durchgefuhrt. Kaninchenantikorper wurden von Charles 
River Deutschland (Kisslegg. Deutschland) gegen dissoziiertes Gesamt-HtH und aufge- 
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reinigtes HtHI erzeugt Das Immunisierungsverfahren wurde durchgefuhrt gemafi MarkI 
und Winter (J. Comp. Physiol. 1596(1989), 139-151). 

4. Limitierte Proteolyse und Isolierung der Fraqmente 

Die limitierte Proteolyse wurde bei 37 " C in 0.13 M Giycin/NaOH, pH 9,6 durch Hinzufu- 

gen eines der nachstehenden Enzyme (Slyriia, Deisenhofen, Deutschland), die in 0,1 M 

NH4HCO3, pH 8,0 gelost waren, durchgefuhrt: Staphylococcus aureus V8-Protease Typ 
XVII (8400), Papain Typ II aus Papaya-Milch (P-3125), Rinder-Pankreas-Elastase Typ IV 
(E-0258), Chymotrypsin und Trypsin. Die Hamocyanin-Konzentration lag zwischen 1 
und 10 mg/ml. Die Endkonzentration des Enzyms betrug 2 % (Gewicht/Gewicht). Die 
Proteolyse wurde nach 5 Stunden durch Einfrieren auf -20 C beendet. Das HPLC- 
Verfahren wurde auf einer Vorrichtung von Applied Biosystems (BAI, Bensheim, 
Deutschland) durchgefuhrt. die mit etnem Modell-1000S-Dioden-Array-Detektor ausge- 
stattet war. Die proteolytischen Fragmente wurden auf kleine Mono-Q-Anionaus- 
tauscher-Saule aufgetragen (Pharmacia, Freiburg, Deutschland). die mit 0,02 M 

Tris/HCl. pH 8. 0 aq uilibriert worde njvaj iun^^ _^ 

Gradienten (0.0 M - 0,5 M CaCI) im gleichen Puffer bei einer Flufirate von 1 ml/min elu- 
iert wurden, Alternativ wurden die proteolytischen Fragmente durch Ausschneiden der 
Banden aus nativen PAGE-Gelen (Markl et al., 1979) J. Comp. Physiol, 133 B, 167-175 
^^^^ isoliert, nachdem sie zuvor mit dem Roti-White-System (Roth, Karlsruhe, Deutschland) 
^^Bgemal3 Fernandez-Patron et al. (1995) Anal. Biochem. 224. 203-21 1 invers-gefarbt wor- 
den waren. Zur nachfolgenden Spaltung mit einem zweiten Enzym wurden die isolierten 
Fragmente zuerst Ubemacht gegen 0.13 M Glyctn/NaOH, pH 9,6 dialysiert, um NaCI zu 
entfernen. 

5. Aminosaurensequenzanalyse 

Die durch das HPLC-Verfahren erhaltenen Proteine wurden in SDS-enthaltendem Pro- 
benpuffer denaturiert und durch SDS-PAGE (Laemmli, 1970, supra; 7,5 % Polyacryla- 
mid) aufgetrennt. Um die Blockierung des NH2-Terminus zu verhindern wurde 0,6 % 
(Gewicht/Gewicht) Thioglykolsaure zum Kathodenpuffer (Walsh et al.. Biochemistry 27 




(1988), 6867-6876) hinzugefugt Die Proteinbanden warden durch Elektro-Transfer auf 
ProBlot-Membranen (Applied Biosystems, Deutschland) in einer vertikalen Blotting- 
Kammer ubertragen (25 mM Borat-Puffer, pH 8,8. enthaltend 2 mM EDTA; 10 min/100 
mA, 15 min/200 mA, 12 h/300 mA). Der Nachweis der einzelnen Polypeptide auf den 
Membranen wurde mit der Ponceau-S-Farbung durchgefuhrt. Die interessierenden Po- 
lypeptid-Banden wurden ausgeschnitten und in einer 477A-Protein-Sequenzier-Vor- 
fiditung v un Appl i ed Biusysiems sequenzi e rt. Die Mengen der auf di e Sequ e nziorvor - 
richtung aufgetragenen Polypeptide lag im unteren pmol-Bereich. 




6. cDNA-Klonierunq und Sequenzanalyse 



Eine Lambda-cDNA-Expressionsbibliothek wurde aus Poly(A"*")-RNA aus Haliotis Man- 
telgewebe unter Verwendung des Vektors Lambda ZAP Express ® gemaft den Herstel- 
leranweisungen (Stratagene, Heidelberg, Deutschland) hergestellt. Die Klone wurden 
unter Verwendung von HtH-spezifischen Kaninchenantikorpern isoliert. Die Nukleo- 
tidsequenzierung wurde auf beiden Strangen unter Verwendung des Taq Dye deoxy 
Terminator©-Systems durchgefuhrt. Die Anordung der Sequenzen wurde mit der Soft- 
ware CLUSTAL W (1.7)® und TREEVIEW ©(Thompson et al., Nucl. Acids Res. 22 
(1994), 4673-4680) durchgefuhrt. 

Beispiel 1: 

Isolierung von HtH und Auftrennung zweier unterschledlicher Typen (HtH1 und 
HtH2) 

Die HSmolymphe wurde aus adulten Seeohren gewonnen. Die Blutzellen wurden durch 
Zentrifugation entfernt und das Hamocyanin wurde sodann durch Ultrazentrifugation 
sedimentiert. Das blaue Hamocyanin-Pellet wurde in "Stabilisierungspuffer" (pH 7,4) 
wieder aufgelost und in der Elektronenmikroskopie untersucht (Figur la). Es bestand 
hauptsachlich aus typischen Di-Dekameren, begleitet von einem kleinen Anteil an De- 
kameren und Tridekameren. Die Denaturierung in 2 % SDS in Gegenwart reduzierender 
Substanzen und anschliefiender SDS-PAGE-Trennung ergab eine einzige Bande, die 
dem Polypeptid mit einem scheinbaren Molekuiargewicht von 370 kDa entsprach. wel- 
ches nur geringfugig unterhalb des scheinbaren Untereinheiten-Gewichts von KLH 




(Figur 1b) liegt. Die vollstandige Dissoziation der Oligomere wie der Di-Dekamere in die 
nativen Polypeptide (Untereinheiten) wurde erreicht durch Ubernacht-Dialyse von HtH 
gegen "Dissoziationspuffer" (pH 9,6). Natives PAGE-Verfahren, das auf diese Proben 
angewendet wurde, ergab eine Haupt- und eine Neben-Komponente (Figur 1c). Die ge- 
kreuzte Immunelektrophorese (gekreuzte IE) unter Verwendung von gegen aufgereinig- 
tes Gesamt-HtH-erzeugten polyklonalen Kaninchen-Antikorpern zeigte zwei Komponen- 
ten, die ii nrnunolo g isch unterschiedlich s i nd, j e doch die k l aGsische Roaktion e in e r t eil 



weise immunologischen Identitat aufweisen (Figur 1d). Ihre praparative Isolierung (Figur 
le-i) zeigte. da/i sie die Untereinheiten von zwei unterschiedlichen HtH-Typen darstel- 
len. bezeichnet als HtHI und HtH2, und die Muster der nativen PAGE- und gekreuzten 
lE-Verfahren konnten jeder einzelnen zugeordnet werden (Figur 1c, d). 




Die Auftrennung von HtHI und HtH2 wurde gemafS des Verfahrens zur selektiven Dis- 
soziation gemad Harris et al., 1995, supra, durchgefuhrt. In Ammoniummolybdat/Poly- 
ethylenglykol war HtHI im Oligomeren-Zustand (Di-Dekamere) vollstandig stabil, wohin- 
gegen HtH2 vollstandig in die Untereinheiten dissoziierte (Figur 1e). Dies ermoglichte 
die quanti tative Sedimentation von HtH1 in de r Ultraz entrifuge, w ohin gegen der grof^te 
Teil des HtH2 im Uberstand verblieb. Aus dem wieder aufgelosten Pellet wurden gro(ie 
Mengen an HtHI durch Gelfiltrationschromatographie zur Homogenitat aufgereinigt, 
welche auch geringe Mengen an 'reinem HtH2 ergab (Figur If). Die Fraktionen wurden 
durch native PAGE (Figur 1g) und gekreuzte IE (Figur 1h, i) untersucht. Das Verfahren 
der selektiven Dissoziation von HtH2 entfernte sSmtliche Tri-Dekamere aus den Proben. 
welches nahelegt. dafi die letzteren aus HtH2, jedoch nicht aus HtHI aufgebaut sind 
(Figur 1e). Das selektive Dissoziationsverhalten von HtH2 und auch die Fahigkeit, Ag- 
gregate zu bilden, die grofier als in vivo -Di-Dekamere sind, entspricht den Eigenschaf- 
ten von KLH2. Umgekehrt ahnelt die Stabilitat von HtHI unter diesen Bedingungen und 
seine Unfahigkeit, sich zu grofieren Aggregaten als Di-Dekameren zu assemblieren. 
dem Verhalten von KLH1. Diese Verwandtschaft wird waiter belegt durch die Reaktion 
von Anti-KLH1 bzw. Anti-KLH2 Antikorpern gegen die beiden HtH-Typen (Figur Ij-m). 




Beispiel 2: 

Analyse der Organisation der HtH1-Untereinheit 

Die acht funktionellen Einheiten (FU's, hSufig als "funktionelle Domanen" bezeichnet), 
die eine Mollusken-Hamocyanin-Untereinheit bilden, unterscheiden sich in der Primar- 
struktur und weisen keine immunologische Kreuz-Reaktivitat auf, wie sich aus gekreuz- 

ter IE ergibt. Im Fall der aufgereinigten HtH1 Untereinheit (Figur 1g. h) wurden geringe 

Konzentrationen funf unterschiedlicher Proteasen (Elastase. V8-Protease, Papain, 
Trypsin und Chymotrypsin) verwendet, welche die Peptid-Bindungen zwischen benach- 

^^^^ barten FU's von KLH1 und KLH2 gespalten hatten (Gebauer et al., 1994, supra, Sohn- 
^^^Bgen et al., 1997, supra). Die Spaltprodukte wurden durch gekreuzte IE und SDS-PAGE 
(Fig. 2) untersucht. Elastase-Behandlung erzeugt acht einzelne FU's, abgeleitet aus der 
Anzahl an unterschledlichen Immunprazipitations-Gipfein in der gekreuzten IE (Fig. 2a) 
und mit dem scheinbaren Molekulargewicht von ca. 50 kDa des Hauptteils der Spaltpro- 
dukte in SDS-PAGE (Fig. 2b). Ein weiterer Prazipitationsgipfel wurde als FU-Dimer er- 
kannt. welches durch unvollstandige Spaltung des Segments ab (Fig. 2a) entstand. 
Durch HPLC-Verfahren mit einer Mono-Q-Saule (Fig. 3a) wurden zwei der Elastase- 
Spaltprodukte in einer ausreichenden Reinheit erhalten, um durch "crossed-line-IE" ihre 
klare Zuordnung zu zwei der acht Prazipitationsgipfel (Fig. 2c,d) zu ermoglichen. Die 
anderen vier Proteasen wiesen unterschiedliche Spaltmuster auf, die aus Gemischen 
_ einzelner FU's und grofSerer Fragmente, enthaltend zwei, drei Oder mehrere FU's be- 
^^^standen (z.B. Fig. 2 e,f). Viele von ihnen waren durch das HPLC-Verfahren in ausrei- 
^^^chender Menge angereichert (Fig. 3b-e), um ihre Identifikation in ihren entsprechenden 
SDS-PAGE- und gekreuzten lE-Mustern zu ermoglichen. Eine Anzahl dieser Kompo- 
nenten wurde N-terminal durch Blot-Transfer von SDS-Gelen auf ProBlot®-Membrane 
(Tabelle I) sequenziert. Die Resultate wurden mit N-terminalen Sequenzen verglichen, 
die aus dem scheinbar orthologen Protein in Megathura crenulata, KLH1 (Tabelle I), er- 
halten worden waren, von dem die vollstandige FU-Anordnung verfugbar ist (Sohngen 
et al., 1997, supra; vgl. Fig. 5b). Das Ergebnis des gesamten Ansatzes fuhrte zur Be- 
stimmung der vollstandigen FU-Anordnung innerhalb der HtHI -Untereinheit (Fig. 2a). 

Insbesondere ergab die Spaltung der HtHI -Untereinheit (1-abcdefgh) mit V8-Protease 
vier Prazipitationsgipfel in der gekreuzten IE (Fig. 2e). Das SDS-PAGE-Verfahren zeigte 




fCinf unterschiedliche Fragmente (Fig. 2f): 220 kDa (5 FU's), 185 kDa(4 FU's), 100 kDa 
(2 FU's), 55 kDa(1 FU) und 46 kDa(1 FU). Das 100 kDa-Fragment wurde durch das 
HPLC-Verfahren (Fig. 3b) isoliert und durch N-terminale Sequenzierung als 1-ab identi- 
fiziert, da die Sequenz identisch zu derjenigen der intakten Untereinheit war (Tabelle I). 
In dem "crossed-line" lE-Verfahren verschmolz 1-ab mit drei Prazipitationsgipfeln des 
Elastase-Spaltmusters. Aufgrund der Auswertung ergab sich, dali sie die Fragmente 1- 

a b , 1-a b zw. 1-b darstellen (F i g. 2g). J e doch v e rbli e b e s unklar, wo l chor Gipf e l 1 a und — 

welcher 1-b darstellt. In einem zweiten Schritt wurde das HPLC-aufgereinigte 1-ab durch 
Elastase in seine Komponenten-FU's gespalten, aus denen eine durch das native PA- 

^^^^ GE-Gel-Streifenverfahren eluiert werden konnte und dem Elastase-Muster durch das 
^^^"crossed-line" lE-Verfahren (Fig. 2h) zugeordnet und N-terminal sequenziert wurde. 

Diese Komponente wies die gleiche N-terminale Sequenz wie die gesamte Untereinheit 
auf und war deshalb identisch zu 1-a. Somit ist die zweite FU des 100 kDarFragments 1- 
b (Fig. 2a; Tabelle I). Ebenso wurden HPLC-aufgereinigtes 1-c und 1-h erhalten (Fig. 
3b), durch N-terminale-Sequenzahnlichkeiten zu den entsprechenden FU's in KLH1 
(Tabelle I) identifiziert und durch das "crossed-line" lE-Verfahren ihren entsprechenden 
Prazipitationsgipfeln in dem Elastase-Muster zugeordnet (Fig, 2ij). Weiterhin wurden 1- 
a, 1-b, 1-c und 1-h identifiziert (Fig. 2a). Unter Verwendung von Papain zur Untereinhei- 
ten-Spaltung wurden funf unterschiedliche Gipfel in dem gekreuzten lE-Verfahren (Fig. 
k) erhalten. Aus einer solchen Probe wurde ein 100 kDa-Fragment (2 FU's) durch das 

^^^^^ HPLC-Verfahren (Fig. 3c) aufgereinigt, welches gemali des "crossed-line" lE-Verfahrens 
^^Bdas bereits identifizierte FU 1-h und eine der vier noch nicht identifizierten FU's enthielt 
und deshalb 1-gh darstellen muR (Figs. 2k, 3c). Tatsachlich wies dieses Fragment eine 
N-terminale Sequenz auf. die Ahnlichkeiten zu KLHI-g (Tabelle I) zeigte. Zur weiteren 
Bestatigung wurde das HPLC-aufgereinigte Fragment 1-gh mit Elastase in seine Be- 
standteil-FU's gespalten, aus denen 1-g aufgereinigt und durch N-terminale Sequenzie- 
rung identifiziert wurde. Es wurde durch "crossed-line" lE-Verfahren seinem Gipfel in 
dem Elastase-Spaltmuster zugeordnet (Fig. 21). 

Das 220 kDa-Fragment aus der V8-Protease-Spaltung (Fig. 2e. f) wurde HPLC-auf- 
gereinigt (Fig. 3b) und fusionierte im "crossed-line" lE-Verfahren mit 1-h, 1-g und drei 
noch nicht identifizierten Gipfein des Elastase-Spaltmusters. Weiterhin wurde das 185 




kDa-Fragment in ausreichender Reinheit erhalten (Fig. 2e, f; 3b), und es wurde gezeigt. 
dali sie die gleichen Komponenten mit Ausnahme von 1-h enthielten. Dies legte nalie, 
da(i das 22 kDa und das 185 l<Da-Fragment 1-defgh bzw. 1-defg sind. Tatsaclnlich war 
die N-terminale Sequenz praktisch identisch und zeigte weiterhin Alinlichkeit zu KLH1-d 
(Tabelie I). Die Spaltung der HtHI-Untereinheit mit Trypsin ergab eine Vielzafil an Kom- 
ponenten in dem Molekulargewichtsbereicli von ein bzw. zwei FU's (Fig. 2m). Mehirere 

de r Kom p on e nt e n wurden in I IPLC-rrakt i onen ang e r ei chert (F i g. 3d). Gin 100 kDo 

Fragment envies sich als besonders nutzlich, da es die gleich N-terminale Sequenz wie 
das Fragment 1-defg aus der V8-Protease-Spaltung aufwies (Tabelie I); deshalb sollte 

C^^^ das 100 kDa-Fragment 1-de darstellen. In dem "crossed-lined" lE-Verfahren fusionierte 
diese Komponente mit zwei der drei noch nicht identifizierten FU-GipfeIn des Elastase- 
Spaltmusters (Fig. 2n), welches deshalb 1-d und 1-e darstellen sollte. und somit eine 
einzige MSglichkeit fur 1-f ubrig liefi. Das "crossed-line" lE-Verfahren zeigte auch, dalJ in 
der 1-de Fraktion weiterhin FU 1-f vorhanden war (Fig. 2n). Die Identifikation von 1-f 
bestStigte durch Spaltung der Untereinheit mit Chymotrypsin (Fig. 2o) und nachfolgen- 
dem HPLC-Verfahren (Fig. 3e). Diese Spaltung ergab unter anderem ein 95 kDa- 
Fragment (2 FU's) welches im "crossed-line'-IE-Verfahren mit 1-g und einem zweiten 
Gipfel (Fig. 2p) fusionierte und deshatb-entweder-+^h-(welches ausgesehlossen werden 
konnte. da 1-h bereits identifiziert war). Oder 1-fg (welches sinnvoll erscheint aufgrund 
des weiteren betreffenden Peaks, der zu dem verbleibenden Kandidaten identisch war) 
sein konnte. Tatsachlich zeigte dieses Fragment eine neue N-terminale Sequenz, wel- 
che in gewisser Weise zu KLHI-f ahnlich ist (Tabelie I). Das letzte Problem bestand nun 
darin, die zwei verbleibenden FU-Gipfel 1-d bzw. 1-e zuzuordnen. Dies wurde unter 
Venvendung von HPLC-isolierten FU's aus Proben gelost, in denen die Untereinheit mit 
Elastase gespalten worden war. (Fig. 2c, d; 3a). Die saurere Komponente in dem ge- 
kreuzten lE-Verfahren war 1-d abgeleitet aus seiner N-terminalen Sequenz, welche 
identisch ist mit der von 1-defgh (Fig. 2c; Tabelie I), wohingegen die basischere Kompo- 
nente des 1-d/1-g-Paares eine neue N-terminale Sequenz (Tabelie I) aufwies und des- 
halb 1-e (Fig. 2a) sein mufite. Somit war die Struktur der funktionellen Einheiten der 
Untereinheit HtHI aufgeklart. 
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Beispiel 3: 

Vergleich der Molekulargewichte und N-terminalen Sequenzen der biochemisch isolier- 
ten funktionellen Einheiten (FU's) aus HtH1 und KLH1. Die unterschiedlichen FU's, jede 
mit einer intakten binuklearen Kupfer-Bindungsstelle, wurden durch limitierte Proteolyse 
als globulare Segmente aus ihrer groBeren Einheit freigesetzt; vgl. Abschnitt "Isolierung 
und Analyse der Einheiten aus HtH1". Die KLH1-Daten wurden aus Sohngen et al., su- 
p i a, enlno ii i i ne i i. Die Zuord n ung als tatsachliche L inhe i t erfolgt e aufgrund des Mo l oku 
largewichtes und des immunologischen Verhaltens (vgl. Fig. 2). Das ungewohnlich 
niedrige Molekulargewicht von isoliertem HtHI-d konnte bedeuten, dafi ein grofJes Pep- 
tid C-terminal abgespalten wurde. 

TABELLE I 



Funktionelle Einheit 


Masse (kDa) 


HtH1-a 


53 


KLHI-a 


50 


HtH1-b 


48 


KLHI-b 


45 


HtH1-c 


46 


KLH1-C 


45 


HtHI-d 


40 


kLHI-d 


50 


HtH1-e 


49 


KLHI-e 


50 


HtH1-f 


50 


KLH1-f 


45 


HtH1-g 


45 


KLHI-g 


45 


HtH1-h 


55 


KLHI-h 


60 



N-terminale Sequenz 

DNWRKDVSHLTDDEVQ 
ENLVRKDVERL 

? 

? 

FEDEKHSLRIRKNVDSLTPEENTNERLR 

KVPRSRLIRKNVDRLTPSE 
VEEVTGASHIRKNLNDLNTGEM 
EVTSANRIRKNIENLS 
I LDHDHEEE I LVRKN 1 1 DL S P 
? 

KLNSRKHTPNRVRHELSSLSSRDIASLKA 

HHL SXNKVRHDL S TL 
DHQSGS I AGSGVRKDVNTLTKAETDNLRE 
SSMAGHFVRKDINTLTP 
DEHHDDRLiADVLIRKEVDFLSLQEANAIKD 
HEDHHED I LVRKNI HSL 




Beispiel 4: 

Kionierung von HMmocyanin-cDNA 

1. Zur Kionierung der cDNA von Hamocyanin wurde naRNA aus dem Mantelgewebe 
des jeweiligen Mollusken isoliert. Der erste cDNA-Strang wurde durch reverse Trans- 
kription mit Oligo(dT) als Primer erhalten. Der zweite Strang wurde durch konventio- 
nelle Syntiiese mit random Primern erhalten. Die so erhaltene cDNA wurde in einen 
Lambda-Expressionsvektor kloniert unter Bildung einer cDNA-Expressionsbibliothek. 
Unter Verwendung eines anti-Hamocyanin-Antikorpers wurde die Bibliothek unter 
geeeigneten Bedingungen abgesucht, wobei positive Klone erhalten wurden. Diese 
positiven Klone wurden isoliert. sequenziert und charakterisiert. 

Aus dem N-terminalen Bereich eines erhaltenen positiven Klons wurde eine cDNA- 
Sonde hergestellt, mit der die cDNA-Bibliothek abgesucht wurde. Die erhaltenen po- 
sitiven Klone werden wiederum isoliert, sequenziert und charakterisiert. 

Um noch weiter 5* gelegene Sequenzen zu erhalten, wurde eine weitere Expressi- 
onsbibliothek aus c DNA hergestellt. die mit Hilfe einer Kombination voji H am ocyanin- 
spezifischen und „random"-Primern erhalten wurde. Diese cDNA-Bibliothek wurde mit 
cDNA-Sonden, die den „N-terminalen" Bereichen der unter (2.) erhaltenen positiven 
Klone entsprechen, abgesucht. Die erhaltenen positiven Klone wurden isoliert, se- 
quenziert und charakterisiert. 

Beispiel 5: 

Kionierung von Hamocyanin-Genen 

Genomische DNA wurde gemafl Standardverfahren isoliert. Die PCR-Reaktion wurde 
mit Hilfe von Hamocyanin-spezifischen Primern durchgefuhrt, um die Genabschnitte der 
interessierenden Hamocyanine zu amplifizieren. Die erhaltenen Amplifikationsprodukte 
wurden in einen geeigneten Vektor (beispielsweise pGem T Oder pGem T easy 
(Promega, Mannheim) kloniert, sequenziert und charakterisiert. 



2. 



3. 
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Beispiel 6: 

Rekombinante Expression von HSmocyanln 

Mit einem cDNA-Klon, der die kodierende Sequenz fur HtH-1d entliait, wurde eine PCR- 
Reaktion durcingefuhrt, urn spezifisch die kodierende Sequenz der Domane 1d zu 
amplifizieren. Als Primer wurden synthetisch hergestellte Oligonukleotide verwendet. 
Primer 1 (stromaufWarts) umfaRt sechs Nukleotlde des Endes der Domane HtH-1c, eine 
Sacl-Schnlttstelle und 12 Nukleotlde des Endes der Domane HtH-1d. 
Primer 2 (stromabwarts) umfalit sechs Nukleotlde des Anfangs der Domane HtH1-e, ei- 
ne Sa/I-Schnittstelle und eine HtH1-d spezifische Sequenz. 



2 


min 


95'C 


30 


sec 




30 


sec 


55°C 


1 


min 


72''C 


35 


Zyklen 




10 


min 


72"C 




Das Amplifikat wurde in dem pGEM T easy PGR Klonierungsvektor (Promega) In XL-1 
Blue (Stratagene) kloniert. Nach Isolation des rekombinanten Plasmids und Restriktion 
mit Sad und Sa/I konnte die cDNA der Domane Id isoliert werden. Der Expression svek- 
itor pQE30 (Qiagen) wurde ebenfalls mit den entsprechenden Enzymen restringiert. 

Anschllefiend wurde die Ligation zwischen der HtH-1d-cDNA (restringiert mit Sad und 
Sa/I) und pQE (restringiert mit Sad und Sa/I) durchgefuhrt. Somit ist eine gerichtete 
Klonlerung der cDNA, kodlerend fur HtH-ld, in einen Expressionsvektor mOglich. Die 
Expression von HtHI-d in pQE in XL-1 Blue erfolgt gemaO, Herstelleranleltung. Die Ex- 
pression weiterer HtHI- HtH2- Oder KLH1- Oder KLH2-Domanen kann analog erfolgen. 




<110> Biosyn Arzneimittel GmbH 



<120> Nukleinsauremolekul , kodierend fur eine 

Hamocyanin-kodierende Nukleinsauresequenz 



<130> P30370-01996 



<140> 
<141> 



<160> 38 



<170> Patentin Vers. 2.0 



<210> 1 
<211> 1228 
<212> DNA 

<213> Haliotis tuberculata 




<400> 1 
agatcatttg 
cgacacatcc 
tccacgacca 
tcactggcac 
tatcggtgtt 
aaatgagacg 
tatatctttt 
cccagtagct 
ggaagatttc 
gataggcggt 
tttctacctt 
caggagacac 
gccatttgct 
gactgacatt 
tgggatgaac 
cttcgcggga 
taaaccgggg 
atgccttgg 
tcccttgat 
cgctcttgat 
ctttgaggat 



actcgtgaag 
gttgatgggt 
gatgcaaaag 
cggctgttcg 
ccttattggg 
tacgtagacc 
gaggagggac 
tttggggagc 
tgcgactttg 
tccgaagatt 
catcattcca 
aagccatatc 
ttcccatcac 
tatgactacg 
cttgaagaaa 
tttctccttg 
acccaaccac 
gcgtttgacc 
gtcgatggag 
acggacctga 
gaaaagcaca 



aggaatacga 
accaggctac 
tcaggttcgc 
ttacccaggt 
actggacaaa 
cgtatggaca 
accatcacac 
attcccatct 
agattcagtt 
actccatggc 
atgtcgatcg 
aagcccactg 
ctcttaacaa 
aggaagtgct 
ttgaagaagc 
ctggaatagg 
tcaaagctgg 
gcttgtataa 
attatgaagt 
ttccacacgc 
gcttacga 



gctaaggatg 
agtagagtac 
ctgttgtatg 
ggaagatgct 
acctatgact 
tacacatcat 
gagcaggatg 
gtttgatgga 
tgagttagtc 
caccctgcat 
tctatgggca 
tgcacagtct 
caacgagaag 
gcactacagc 
tatacatctc 
aacatctgca 
agatattgcc 
ggtcgaaata 
cacttttaaa 
agcagttgtt 



gctctggaga 
catggccttc 
catggcatgg 
cttgtacggc 
caccttccag 
aatccattct 
atagattcga 
atcctgtacg 
cataattcta 
tacacagcct 
atctggcaag 
gtggaacagt 
acacatagtc 
tacgatgatc 
agacaacagc 
cttgttgaca 
attcttggtg 
actgactcat 
attcatgata 
tctgagccag 



gattccaggc 
ctgctcgttg 
catccttccc 
gtggatcgcc 
acttggcatc 
tcaatgcaaa 
aactgtttgc 
catttgagca 
ttcatgcgtg 
ttgaccccat 
ctcttcaaat 
tgccaatgaa 
attcagtccc 
taacgtttgg 
atgaacgagt 
ttttcataaa 
gtgccaagga 
taaagacact 
tgcacggaaa 
ctcaccctac 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

6„6P 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1228 



<210> 2 
<211> 1210 
<212> DNA 

<213> Haliotis tuberculata 



<400> 2 

atcagaaaaa atgtcgacag cttgactcct 
gagcttcttg aaaatgatca tactgtaggt 
gagcctaaat ggtgccctaa tcctgaagcg 
atggccgttt tcccacattg gcacaggctt 
aagcatgggt acagtggtgc tctaccatac 
cctgatctgg ttagtcatga gcagtataca 
ccjgtggttca atggccacat cgatacagta 
gatctttatc aacaacctga atttggacat 
gcattagaac aagatgactt ctgttcgttt 



gaagaaacaa atgaactgcg taaagccctg 60 
ggattcaatc agcttggcgc cttccatgga 120 
gagcacaagg ttgcctgctg cgttcatggc 180 
cttgctctcc aggcggagaa tgctcttaga 240 
tgggattgga ctcgccccct ttcccaactt 300 
gatccttccg accatcacgt gaagcataac 360 
aatcaggata ccaccagaag cgtacgggag 420 
ttcacggata ttgctcaaca agtcctctta 480 
gaagtgcagt atgagatttc ccataatttt 540 



atccatgcac 
tacgatccaa 
tccctgcaaa 
agaaggcccc 
gagcatgcta 
accctggaat 
agtcacgaaa 
aaattcgaag 
ggggacgaaa 
gttctggaag 
gatcttaaag 
tccggcacag 



ttgtaggagg 
tctttttctt 
aatacagagg 
tgcaaccatt 
tcccgtttga 
ttaatggttt 
gagtatttgc 
tttgtactcc 
acgagatggc 
caaaccatct 
gagtgagttt 



aaccgacgct 
gcatcattca 
caaaccgtac 
tggactaagc 
tgtcttcaac 
gtcgatttca 
tggattcttg 
acctgataat 
ttgggcctat 
acacttctat 
gggaactgac 



tatggcatgg 
aacaccgaca 
aacactgcca 
agtgccatta 
tatagagata 
caacttgata 
ctgtcgggga 
tgtcataaag 
gaccgacttt 
gatcatctct 
ctgttccaca 



catcgctgag 
ggatctgggc 
actgcgccat 
accctgacag 
accttcatta 
gagagctgga 
ttaaaaaatc 
caggggagtt 
tcaagtatga 
tcattcgcta 
ctgcaaatgt 



atatacagca 
tatttggcaa 
agaatctatg 
aatcaccaga 
cgtatatgat 
aaaaatcaag 
tgctcttgtg 
ttatctactc 
tattactcag 
cgaagtcttt 
ggtacatgat 



600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1210 



<210> 3 



<211> 1239 
<212> DNA 

<213> Haliotis tuberculata 



<400> 3 
gcacccgtga 
atttgaacga 
aggacgacgg 
tgaatgatca 
gactgtatgt 
cttactggga 
acttcaattc 
ttgaaaacgc 
atgagaatgt 
agcttgttca 
ccctggacta 
tgtgggcaat 
gtgcaatcaa 
acaatgtcac 
gatacaagta 
tgaagcaaag 
cttctgctga 
gtcatgaggc 
accgtttgta 
tggagtttt 
tacctttga 



tcgtgataac 
cctcaatacc 
aacatatgaa 
taatattgcg 
ggttcaggtg 
gtggactgct 
ccgacaacag 
agtcacaaca 
tttacttgca 
taacgcactt 
ttctgcgttt 
ctggcaggaa 
cctcatgcat 
tttgaaatac 
tgacaacctt 
gagacatcac 
cataactatc 
gggaacattc 
taaatttgaa 
cgaactggag 
tccaactatc 



tacgttgaag 
ggagaaatgg 
tctattgccc 
tgttgtgtcc 
gagaatgctc 
cccatagacc 
cggtacgacc 
agggacccac 
ctggagcagg 
cattccatgc 
gatcccgtct 
ctacaaagat 
caaccactga 
tcaaaaccac 
gagttccatc 
gacagagtgt 
tacatatgtc 
tatatcctcg 
atcaccaaac 
cttgagatca 
atctttgaac 



aagttactgg 
aaagccttag 
agtaccatgg 
atggtatgcc 
tcctaaacag 
atctacctca 
ctaacccttt 
aagccgggct 
aaaattattg 
tgggaggtaa 
tcttcctaca 
tccgagaact 
agccgttcag 
aggacggatt 
acttatccat 
ttgcgggctt 
tgcctgacgg 
gaggcgaaac 
cactgcaaca 
aggcatacaa 
ctggaacag 



ggccagtcat 

agctgctttc 

caaaccaggc 

taccttcccc 

gggatctggt 

tttcattgat 

cttcagggga 

cttcaactca 

tgactttgaa 

agggcagtac 

tcatgccaac 

gccttatgaa 

tgatccaca.t- 

cgactaccag 

cccaagtctt 

ccttcttcat 

acggcgtggc 

agagatgcct 

gttaggagtc 

cggttcccat 



atcaggaaga 
ctgcatattc 
aaatgtcaat 
cagtggcaca 
gtggctgttc 
gatgcaacat 
aaggttactt 
gattatatgt 
attcagtttg 
tccatgtcct 
acggacagac 
gaagcgaact 
.gagaatcacg. 
aaccacttcg 
gatgctaccc 
aacataggaa 
aatgactgca 
tttatctttg 
aagctgcatg 
ctggatcccc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

.7_8.Q__ 

840 

900 

960 

1020 

1080 

1140 

1200 

1239 



<210> 4 

<211> 1260 

<212> DNA 

<213> Haliotis tuberculata 



<400> 4 

atacccatat 

atttgagccc 

gctccgctga 

atccatctgc 

ggcacagact 

gtattcctta 

caacatttta 

tagaatttga 

acagtgggga 

aacaggaaga 

catggattgg 

caattttcta 



cttggaccac 
aagggagagg 
tgggtaccaa 
agctcaccgt 
gtacactgtt 
ctgggactgg 
tcatccaatc 
aggaccgggc 
tcatgacgga 
ttactgcgat 
tggaagcgca 
catccaccat 



gaccatgagg 
gtttctctag 
gccattgcct 
tatgcttgct 
caggttcagg 
acaaaaccag 
cggaatatta 
gttcatacag 
taccacaact 
tttgaaatac 
gtacatggca 
tcacagacgg 



aagagatact 
tcaaagcttt 
ctttccatgc 
gtgtccatgg 
atgccctgag 
tcaacgagtt 
atatttcaaa 
agaggcacat 
ggttcttcga 
aatttgagat 
tgggacacct 
acagaatatg 



tgtcaggaag 
gcaaagaatg 
cctgccacca 
catggctaca 
gagacatggt 
acccgagctt 
tccattcctc 
aaatactgag 
aactgttctc 
agcccataat 
tcactatgca 
ggctatttgg 



aatataattg 
aagaatgatc 
ctctgtccca 
tttccccagt 
tcacttgttg 
ctttcttcag 
ggggctgaca 
cgcctgtttc 
tttgctttgg 
ggcatccaca 
tcatatgatc 
caagagctgc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 



agaagtacag 
ccttgaagcc 
caaagcctga 
tggaggggcg 
gaacttttgc 
tttgcagagt 
ccgaaatgcc 
acatgaacct 
gaacagtact 



gggtctatct 
ttttagcttt 
ggacacgttt 
atcaatttct 
agggttcctc 
tgatcacacc 
atgggcgttc 
gaggcacgag 
ctcgggagac 



gggtcggaag 

gggccaccct 
gactataaga 
cgcattgatg 
cttaaaggtt 
tgtaaagatg 
gacaggcttt 
gacaccttct 
ctcatccaga 



caaactgtgc 
acaatttgaa 
agtttggata 
aacttatcca 
ttggtacatc 
cgggctattt 
ataagtatga 
ctatagatgt 
cgccctccat 



cattgaacat 
tagtcatacg 
cagatatgat 
gcagagacag 
cgcatctgtg 
cactattctg 
cattactaaa 
aactatcacg 
tatatttgta 



atgagaacac 780 
caagaatatt 840 
agtctggaat 900 
gagaaagaca 960 
tcattgcaag 1020 
ggaggatcag 108 0 
actcttcacg 1140 
tcttacaatg 1200 
cctggacgcc 12 6 0 



<210> 5 

<211> 1251 

<212> DNA 

<213> Haliotis tuberculata 



<400> 5 

ataaactcaa 

gttcccgtga 

ctgatggtta 

ctggacgtga 

tgtacactct 

actgggactg 

atgacgtttg 

aagatgcatt 

agcactcgct 

tcgaagttca 

cgtacgcctt 

cgtttgttga 

ttagaacagc 

atttcaacca 

aagatcttgg 

aggcgttaat 

gattaggaac 

atgctggtgt 

tctacaagta 

tccatgctga 

ttccatcgtc 



ctcacggaaa 
catagcaagc 
tcaagctatt 
gatcgcctgt 
gcagttggag 
gaccaagcca 
gcaaaatgcc 
tacggtgaga 
tctgtttgac 
gtttgaagtg 
ctcctctctc 
caaaatatgg 
tgattgtgct 
caactcgttc 
ctataactat 
agcaaaacgc 
ttcggctgat 
gattttcatc 
tgacattaca 
tgaaccattt 
tcatcttcac 



catacaccta 
ttgaaggcag 
gctgccttcc 
tgcatccacg 
caagcgctgc 
atcaccgaac 
gtcttggcca 
aatgtccagg 
caggctttgt 
atgcataaca 
gagtattcct 
gctgtatggc 
gtgggcctca 
accaagaagc 
gacaaccttg 
aagtcacatg 
atacatctgg 
cttggaggtt 
gaagcattgc 
ttcctgaggc 
cagccaacga 



acagagtccg 
ctttgacaag 
atggcgttcc 
gcatggcgac 
gcagacacgg 
tgccacacat 
atccgtttgc 
aaagtctgtt 
tggctcttga 
cgatccatta 
catacgatcc 
aagaactgca 
tgggtcaggc 
acgcagtccc 
aaatcagtgg 
ctagagtctt 
aaatttgcaa 
ctgcagagat 
aggaatttga 
tgtcggttgt 
taatctatga 



ccatgagcta 
ccttcaacat 
tgcgcagtgc 
gtttcctcac 
gtccagtgtt 
tctgacagac 
aagaggttat 
caaaatgtca 
acaaactgac 
tctcgtagga 
aatcttcttt 
aagcaggaga 
aatgaggcct 
taatacagta 
tttaaactta 
tgctgggttc 
gacatcggaa 
gcattgggca 
catcaaccct 
tgctgtgaat 
accaggcgaa 



agtagcctta 
gataatggga 
cacgagccat 
tggcaccggt 
gctgttccat 
ggagaatatt 
gtgaaaatta 
agttttggaa 
tactgtgact 
gggcgtcaaa 
attcaccact 
catctacagt 
ttcaacaagg 
tttgattatg 
aatgagatcg 
ctgttgtttg 
aactgccatg 
tacaaccgcc 
gaagatgttt 
ggaactgtca 

g 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1251 




<210> 6 

211> 1209 
'<212> DNA 

<213> Haliotis tuberculata 



<400> 6 

atcaccatga 

acaccttgac 

accacggtcc 

ccatgcctga 

ggcatcgcct 

gcctgcccta 

cggacaacaa 

ctccccgaga 

aagtcctctt 

cccacaatgc 

acttcactgc 

ctgtctggca 

tccaggcaat 

caaaggctaa 

acaacctcat 



cgaccatcag 
taaggctgag 
caatggcttt 
tggccacaac 
ctacaccaag 
ctgggactgg 
cccctttcaa 
catgctgttc 
agctctggaa 
catccattcc 
ctacgatcct 
agctttgcaa 
gaaaacgccc 
cgcgaagcca 
cttccatgga 



tcgggaagca 
accgacaacc 
caagctattg 
tactcatgtt 
cagatggagg 
actgctgcct 
catggacaca 
aacgaccccg 
caaactgatt 
tggacaggtg 
ctcttctggc 
gaatacagag 
ctgaggcctt 
ttagatgtgt 
tacagtattc 



tagcaggatc 
tgagggaggc 
ctgctttcca 
gtactcacgg 
atgcaatgag 
tcacccacct 
ttgattatct 
agcatggatc 
tctgcaaatt 
gccacagccc 
ttcaccactc 
gacttccata 
tcagtgacga 
tcgagtataa 
cggaacttga 



cggggtccgc 
gctgtggggt 
tggaaaacca 
catggctacc 
ggcgcatggg 
gccaacactg 
caatgtcagc 
agagtcgttc 
cgaagttcag 
ctacggaatg 
caacaccgac 
caaccatgcc 
tatcaaccac 
tcggttgagc 
tcgcgtgctt 



aaggacgtga 
gtcatggcag 
gctttgtgtc 
ttcccacact 
tctcatgtcg 
gtcaccgaca 
acaactcgat 
ttctacagac 
tttgagataa 
tccactctcg 
agaatctggg 
aattgtgaga 
aacccagtca 
ttccagtacg 
gaagaaagaa 



60 

120 

180 

240. 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 



32..- 




aggaggagga 
tagtgttcga 
tgggagggga 
^9gt9at9aa 
tcggcactga 
aacctggcg 



cagaatattt 
catatgccag 
gctagaaatg 
gcagctacac 
cgaccacgag 



gctgccttcc 
ccaggacacg 
ccctggtcct 
ctgaggcatg 
cttccttccg 



ttctcagtgg 
aatgtgtgtt 
ttgacagact 
actcggactt 
acagtgtcaa 



aatcaagcgt 
cgcagggact 
gttccgctat 
tacgttcagg 
agcaccaact 



agtgctgatg 960 
tttgcgattt 1020 
gacatcacca 1080 
gtgaagattg 114 0 
attgaatttg 1200 
1209 



<210> 7 

<211> 1535 

<212> DNA 

<213> Haliotis tuberculata 



<400> 7 
tgcacagagg 



cgggaagcac gaagatgaac accatgatga cagactcgca 



gatgtcctga 
gatgcactgt 
tatcacgggt 
cacggaatgc 
ctgaaaaacc 
agtcttccat 
cggggcgtgc 
tttggtgaat 
tgtgactttg 
actggacagt 
caccactcga 
aagccttact 
ttcaactacg 
ctgtttgacc 
atacatgaac 
tttgttttgt 
gatacaagtc 
ccgtgggcat 
gtgaaagatg 
accaccaggc 
ttggtaatcc 
accaaagtcg 
agctatactg 
gacaaagtct 
tgtgagcaga 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1535 



c 

'm 




taaggaaaga 
acaagctcca 
atcctaatat 
ccgtgttccc 
atggctctcc 
tttctttgg 
gcacgaaac 
ttgattacct 
aagttcagta 
attccatgtc 
gtttggatag 
acgcattgga 
aaaccgttaa 
actacaggtt 
ttgaagaggt 
cgggcttacg 
acgaagaata 
atgaaagaat 
aagacatccg 
tgtctcagcc 
cagtaggtgc 
agtttacacc 
ctatggctaa 
acagcgtcga 
cctcaggct 



agttgacttc 
gaatgacgac 
gtgtccagaa 
ccactggcat 
aatgggtatt 
agattccagc 
aaccagggac 
atattaccta 
tgagatcctc 
taccctggag 
aatctggatc 
ttgtgctggc 
tgaagatgaa 
caactatgaa 
aattcaggaa 
gatatcagct 
tgcaggagaa 
gctgaaattg 
ttttagagtg 
attcatcgtc 
gggccatgac 
aatagattcg 
atgcatcgtt 
tcacggagac 
ccacatccac 



ctctccctgc 
agtaaaggcg 
agaggtaccg 
cgcctgcaca 
ccttactggg 
aacaacaacc 
gttaatcaga 
actctgcaag 
cataacgccg 
tattcagcct 
ctttggcaga 
gacagactta 
ttcacccgca 
tacgataaca 
ttaagaaaca 
acagtgaaag 
tttgcagttt 
gacatctccg 
gttgttactg 
caccgtccag 
cttccgccta 
tcggtgaaca 
ccccctttct 
tactacattg 
gtggaacacg 



aagaggccaa 
gctttgaggc 
acaagtatcc 
ccattcagat 
attggacaaa 
ccttctacaa 
gactctttaa 
tcctggagga 
tccactcctg 
tcgaccctgt 
agttgcaaaa 
tgaaagaccc 
tcaactcttt 
tgagaatcag 
aagatcgcat 
tattcattca 
tgggaggtga 
atgctgtaca 
cctacaacgg 
cccatgtggc 
aagtcgtagt 
aagcaatggt 
cttaccacgg 
ctgcaggtac 
agtag 



cgcaattaag 
catagctggc 
ctgctgcgtc 
ggagagagct 
gaagatgtcg 
atattacatc 
tcaaaccaag 
aaactcatac 
gcttggagga 
cttcatgatt 
gataagaatg 
cctgcatccc 
cccaagcata 
gggtcaggac 
atttgctggt 
ttcgaaaaac 
gaaggagatg 
caagcttcac 
tgacgttgtt 
tcacgacatc 
aaagagcggc 
ggagctgggc 
ctttgaactg 
ccacgcgttg 



^210> 8 
<211> 317 
<212> DNA 

<213> Haliotis tuberculata 



<400> 8 

gtttctttct gtcacatatt ggtacatcag 

ctcttcatac ctccgtgggc acgtttgctg 

gatttgaccg tttgtacaaa tatgagatta 

ctgatgatgt tttcagcatc tctgttaaag 

ctgaactcat cccatctgct gctatcatct 

cgcatcatga cacaatc 



cgaatgttga aatcattata gaccatggga 60 
ttcttggcgg agagaaggag atgaaatggg 12 0 
cagatgaact gaggcaactt aatctccgtg 180 
taactgatgt tgatggcagt gagctgtcct 240 
tcgaacgaag ccatattgac catcaggacc 300 

317 



<210> 9 
<211> 1219 
<212> DNA 

<213> Haliotis tuberculata 



<400> 9 



a 



attaggaaaa 
gcagaccttc 
gaacccaaat 
atggctgtct 
aagcatggat 
cctgatttgg 
cgaaacccct 
cgtcaagaac 
cttctggctt 
aatttcattc 
actacttatg 
tggcaggctc 
tctatgagaa 
acaagacagc 
tatgacaccc 
agaaagtctc 
ctagttaaat 
tacatccttg 
atcactgagc 
aagcgtttg 
tacatgacg 



atgttgaxaa 
aatcagacaa 
ggtgcccaag 
tccctcactg 
gtctcggagc 
ttttggtaag 
ggtacagcgg 
tgtatgaagc 
tggagcagga 
acgctcttgt 
atccaatttt 
tacaaaagta 
aacccctaca 
atgctgttcc 
ttgacttcaa 
atgacagagt 
tctttgtctg 
gtgatgaagc 
agctcaatgc 
atcttcatgg 
aaggggcag 



~T:cccacaccc 
aaccgccggt 
tcccgatgct 
gcacagactc 
tctcccctac 
tagcagaact 
ccatattgat 
tcctggattt 
tgacttctgt 
cggcggaagc 
ctacctccat 
caggggcaaa 
accctttggt 
tttcagtgtc 
cggactatca 
atttgccgga 
caaatcagat 
tgaaatgcca 
cctggatcta 
tacaagtctt 



ggattccagc 
gagaagaagt 
ctgaccgtgc 
tgggactgga 
acaccgatgc 
acagttggtg 
ggccattata 
gattttgaag 
gagccatatg 
cattctaaca 
ccttacaatt 
ctgactgatg 
tttgattaca 
atctcccagc 
tttttgctgc 
gatgactgtg 

t-ggggctatg 

cacatcggag 
ggaagcaaca 



aaattgctgc 
tctcctgctg 
aaggcgagaa 
ctcggcccct 
catattccac 
ttgacacaac 
ctggggtcgc 
tccagtttga 
gtatggcgtc 
ctgacagact 
ccgccaactg 
agatcaaccc 
agaacaactt 
tggaccgtga 
atggtattca 
accactatgc 
atcgtcttta 
atagattctt 
tcttccccaa 



ttttcacggg 
tgtccatgga 
tgccctgaga 
gtctcaccta 
cgtggaagcc 
aagaagcgtc 
taagcaagtg 
gatagctcac 
actccgttac 
ctgggctata 
cgccattgct 
ggatgatgag 
caattatgaa 
actgtcacgg 
gcagtctgca 
tggtgaattc 
caaatatgag 
catcagatac 
accttctgtc 



6 0 

120 

180 

240 

300 

360 

420 

480 

540 

600 
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720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1219 



<210> 10 

<211> 1244 

<212> DNA 

<213> Haliotis tuberculata 




<400> 10 

gtcaccatca ggctgacgag tacgacgaag ttgtaactgc tgcaagccac atcagaaaga 60 
atttaaaaga tctgtcaaag ggagaagtag agagcctaag gtctgccttc ctgcaacttc 120 
agaacgacgg agtctatgag aatattgcca agttccacgg caagcctggg ttgtgtgatg 180 
ataacggtcg caaggttgcc tgttgtgtcc atggaatgcc caccttcccc cagtggcaca 24 0 
_ggctctatgt cctccaggtg gagaatgctt tgctggagag aggatctgcc gtctctgtgc 3 00 
catactggga ctggactgaa acatttacag agctgccatc tttgattgct gaggctacct 360 
atttcaattc ccgtcaacaa acgtttgacc ctaatccttt cttcagaggt aaaatcagtt 420 
ttgagaatgc tgttacaaca cgtgatcccc agcctgagct gtacgttaac aggtactact 480 
accaaaacgt catgttggtt tttgaacagg acaactactg cgacttcgag atacagtttg 54 0 
agatggttca caatgttctc catgcttggc ttggtggaag agctacttat tctatttctt 600 
tcttgatta ttctgcattc gaccctgtgt ttttccttca ccatgcgaac acagatagat 660 
gtgggccat ctggcaggag ctgcagaggt acaggaagaa gccatacaat gaagcggatt 72 0 
-3'tgccattaa cctaatgcgc aaacctctac atcccttcga caacagtgat ctcaatcatg 780 
atcctgtaac ctttaaatac tcaaaaccca ctgatggctt tgactaccag aacaactttg 840 
gatacaagta tgacaacctt gagttcaatc atttcagtat tcccaggctt gaagaaatca 900 
ttcgtattag acaacgtcaa gatcgtgtgt ttgcaggatt cctccttcac aacattggga 960 
catccgcaac tgttgagata ttcgtctgtg tccctaccac cagcggtgag caaaactgtg 1020 
aaaacaaagc cggaacattt gccgtactcg gaggagaaac agagatggcg tttcattttg 108 0 
acagactcta caggtttgac atcagtgaaa cactgaggga cctcggcata cagctggaca 114 0 
gccatgactt tgacctcagc atcaagattc aaggagtaaa tggatcctac cttgatccac 1200 
acatcctgcc agagccatcc ttgatttttg tgcctggttc aagt 1244 



<210> 11 
<211> 1284 
<212> DNA 

<213> Haliotis tuberculata 



<400> 11 

tctttcctgc gtcctgatgg gcattcagat 

ctgacaacca gggagactgc atctctgatc 

tcacctgacg ggttccaagc cattgcctct 



gacatccttg tgagaaaaga agtgaacagc 60 
catgctctga aaagtatgca ggaagaccat 120 
ttccatgctc tgccaccact ctgcccttca 180 



a 
< 



ccatctgcag 
cacagattgt 
gtaccgtatt 
acataccatg 
gagtttgaag 
aaaggtggac 
gaaaactact 
gtcggaggca 
ttctaccttc 
cagagagggc 
aagcctttca 
cccgaggaca 
ggaatgtcag 
ttcgctgggt 
agagctgatt 
atggcgtggg 
caccttcgat 
gtcctgagca 
ataaatacca 



ctcaccgtta 
acactgtaca 
gggattggct 
atatttggag 
gagaaaacat 
acgtttttga 
gtgactttga 
gtcgtaccta 
accatttcca 
tctcgggtga 
gcttcggcgc 
ccttcgacta 
ttgctgaact 
tcctgttgag 
ccacatgtca 
catttgacag 
atgatgatga 
gcagtctaat 
ggagcatgtc 



tgcttgctgt 
gttccaggat 
gcgaccgcag 
taacagagat 
tacaacagag 
taaactggtt 
gattcagttt 
ctctatcgga 
gacagaccgt 
tgaggctcac 
tccttataac 
caggaagttt 
ggatcaatac 
tggattcgga 
ggatgctggg 
gctttacaaa 
cttcacaatc 
cccaacaccg 
accg 



gtccacggca 
gcactgagga 
tctcacctac 
ttccccaatc 
agagaagtca 
cttcaaacaa 
gaaattcttc 
catcttcatt 
atttgggcaa 
tgtgctctcg 
tggaatcagc 
ggttatgaat 
attattgaac 
ggttccgcat 
tacttcaccg 
tatgacatta 
tctgtcagtc 
agtgtcatat 



tggctacatt 
gacatggagc 
cagagcttgt 
ctttctacca 
ttgcagacaa 
gccatcctag 
acaacggcgt 
acgcattcta 
tctggcaaga 
agcaaatgag 
tcacacagga 
atgacaattt 
atcaagaaaa 
cagttaattt 
ttcttggtgg 
ctgaaactct 
tgaccgccaa 
tccagcgggg 



tccccagtgg 
tacggtaggt 
caccatggag 
agccaatatt 
actttttgtc 
cgctgagcag 
tcacacgtgg 
cgaccctctt 
actccaggaa 
agaaccattg 
tttctcccga 
agaattcctg 
tgatagagta 
ccaggtttgt 
cagtgetgag 
ggagaaaatg 
caacggaact 
acatcgtgac 



240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1284 



210> 12 
<211> 1221 
<212> DNA 

<213> Haliotis tuberculata 




<400> 12 
aaccgtgttc 
gctctgcgag 
catgggctac 
gggatgccga 
aggagacatg 
ctcccctcgc 
aacccattct 
gagatgctgt 
gctcttgagc 
atccactacc 
tacgacccat 
gctcttcaaa 
ctaaaccaa 
cagttccca 
taggtggca 
cgcgtttttg 
atttgtagaa 
aaggaaatgc 
aatgctggca 
gagatccatg 
atctattctc 



gccgtgagct 
acctacagga 
cagcaggcrg 
ccttccccca 
gatcatctgt 
tcttcaccag. 
ccaaaggttt 
tccagctttg 
aaaccgacta 
ttgttggtgg 
tcttctttat 

tgaggccatt 
acacactcta 
ggaatctcga 
ctggattctt 
atgaaaatga 
catggtcatt 
ttagcccaga 
ctgttaacaa 
ctggggaagg 



gagcgatctg 
9gatgatggc 
ccatgatagc 
gtggcacaga 
cgccatcccc 
ccctgagtat^ 
tgtcaaattt 
tgaacatgga 
ctgtgatttt 
acgtcagacc 
acaccattcc 
acttccatac 
tgactccgat 
tgactacgag 
ccagcttcag 
gcttcgtgga 
ctgccacagg 
tgacagaaac 
ggacgtgttt 
gaccatgata 
t 



tctgcgaggg 
cccaacggat 
cggggaaatg 
ctgtacaccc 
tactgggact 
tatgaccc_at 
gcaaatacct 
gagtcaatcc 
gaggtacagt 
tacgcattgt 
tttgtggata 
aagcgagctg 
atgaatcaga 
acactgtact 
gctgaaattg 
atcggaactt 
ggtggaataa 
ttcaagtttg 
gatgctgagg 
ccgtcgtctg 



acctgtctag 
accaggctct 
agatcgcatg 
tgcagttgga 
ggacaaagcc 
ggcatgatgc 
acacagtaag 
tctatgagca 
ttgaggtcct 
cttctctgca 
agatgtgggt 
actgtgctgt 
acccattcac 
acagctacga 
acagaagcag 
ctgctgatgt 
ttttcatctt 
atatcaccca 
agccatttta 
tgatcccagc 



tctcaagtct 
tgcagccttc 
ttgcattcac 
gatggctctg 
tatctccgaa 
tgtggtaaac 
a g a ccc a c ag 
aactcttctt 
ccataacgtg 
ttatgcctcc 
agtatggcaa 
caacctaatg 
aaagatgcac 
taatctcgaa 
aagccacgat 
caggttttgg 
aggtggagcc 
tgtactcgag 
tatcaaggtt 
cccaactatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

9 00 

960 

1020 

1080 

1140 

1200 

1221 



<210> 13 
<211> 1205 
<212> DNA 

<213> Haliotis tuberculata 



<400> 13 

cgcgctgctg acagtgcaca ctcggccaac attgctggct ctggggtgag gaaggacgtc 60 
acgaccctta ctgtgtctga gaccgagaac ctaagacagg ctcttcaagg tgtcatcgat 120 
gataccggtc ccaatggtta ccaagcaata gcatccttcc acggaagtcc tccaatgtgc 180 
gagatgaacg gccgcaaggg tgcctgttgt gctcacggta tggcctcctt cccacactgg 24 0 
cacagactgt atgtgaagca gatggaagat gccctggctg accacgggtc acatatcggc 3 00 



atcccttact 
gagaacaatc 
cccagagaca 
gtcctcctgg 
cacaacgcca 
ttcacagcct 
gtctggcaag 
caggttctga 
aagactaatg 
acccttagct 
agagaagaga 
gtctttgaca 
ggaggggagc 
gtcatgaatc 
gccaccaatg 
cttgg 



gggactggac 
ccttccatga 
tgctgtttaa 
ctttggagca 
ttcactcctg 
acgatcctct 
cactgcagaa 
aacagccctt 
ccaggcctat 
tccatggtaa 
gaacatttgc 
tctgccggcc 
tagaaatgcc 
agctccatct 
gcactgagct 



aactgccttc 
gggtcgcatt 
cgacccagag 
gactgactac 
gacaggtgga 
cttctggctt 
ataccgagga 
gaggccattc 
cgattcattt 
gagcatccct 
tgccttcctt 
caatggtgac 
ttggtccttc 
ccagtatgat 
ttcatcagac 



acagagttac 
gatcatctcg 
caaggatcag 
tgccagttcg 
cgtagccctt 
caccactcca 
ctcccataca 
aacgatgaca 
gattatgaga 
gaactgaatg 
cttcgtggaa 
tgtgtctttg 
gacagactgt 
tcagatttca 
cttctcaagt 



ccgcccttgt 
gtgtaaccac 
agtcgttctt 
aagtccagtt 
acggaatgtc 
acaccgacag 
acgaagcaca 
tcaaccacaa 
ggtttaacta 
acctgctcga 
tcggttgcag 
caggaacctt 
tccgctatga 
gtttcagggt 
caccaacaat 



cacagactcc 
gtcacgttcc 
ctatagacaa 
tgagctgacc 
gaccctcgag 
aatctgggct 
ctgtgaaatc 
tccaatcacc 
tcagtatgac 
ggaaagaaaa 
tgctgatgtc 
tgctgtgctg 
catcaccaga 
gaagcttgtt 
tgaacatgaa 



360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1205 



<210> 14 

<211> 1546 

<212> DNA 

213> Haliotis tuberculata 




<400> 14 
agcccacaga 
acactttcat 
tgccctttac 
ccatggatac 
ccggatgggc 
tgagcacaat 
actgccggcg 
cggtgttggt 
ccatggttat 
ggactttgag 
ccagaagtat 
tcactcgggt 
gccctacaac 
ctatccatct 
tgacagccat 
gaactcaac 
ttgtcaggc 
gaagaagtt 
gcgagttttc 
acacccttta 
agagcctacc 
gttatcccag 
ccgcatcgag 
ctacactgca 
ccacgtctat 
ccagaatgca 



ggaccagttg 
cgtaaggaag 
aagctacaga 
cccaatctgt 
atctttcctt 
ggtgcactgc 
ttcttctccg 
cacgacaccg 
gattatctct 
gttcagtatg 
tccatgtcta 
ctagacagac 
ttcgctaaat 
atcaaccagg 
aagttcggct 
acaatcatca 
atcggtacgt 
ggaactttca 
aagtatgaca 
acttccggaa 
caaatccttt 
tanggaagaa 
ttccacccag 
ctcttcaact 
tctgtcaagc 
gatgtcagga 



aagaaacaga 
ttgattcgct 
acgaccacag 
gtccggaaga 
actggcacag 
ttggtgttcc 
actccagcaa 
tcagagagcc 
attacctagc 
agatcctcca 
ccctggagta 
tttggatcat 
gtgcttatca 
acgagttcac 
accattacga 
atgacttgag 
ctgctagtgt 
ctgtcctggg 
tcacagaggt 
ctggagatca 
catcatctac 
accttcacat 
tcgatgattc 
gtgtggtacc 
ctggtgacta 
ttcatatcca 



agtcactcgc 
gtccctggat 
tctaacggga 
aggcgatgac 
actcttgacc 
ttactgggac 
caacaatccc 
aactagtctt 
attgaccacg 
caacgccgt_c 
ttcggccttt 
ctggcaagaa 
tatgatggaa 
ccgtgccaac 
taacctgaat 
aaacacagac 
caagatctat 
aggagagagg 
tgcagataga 
catccttacg 
agacctgcca 
ccctcccaaa 
agttacgaga 
accgttcaca 
ctatgttact 
tgttgaggat 



caacatactg 
gaagcaaaca 
tacgaagcaa 
aaaatacccc 
attcaactgg 
tggaacaagg 
tacttcaagt 
atatataacc 
cttgaagaaa 

gaccctgtct 
cttcagaaga 
gagccactgg 
tccaagcctt 
gttagaggtc 
agaatctacg 
ctccgaacag 
gaaatgccat 
cttaaaatta 
aatggaatcg 
atcatgacta 
gttgtcgtca 
ccagttgttg 
taccacggat 
ggacccacga 
gagtaa 



acggcaatgc 
acttgaagaa 
tctctggtta 
tgctgcgtcc 
aaagagctct 
acctgtcgtc 
accacatcgc 
agccccaaat 
acaattactg 
ttggaggatc 
ttatgatcct" 
tcaggagaaa 
cgcccttcag 
ctacagtttt 
acagcatcca 
caggatttgt 
atgacaatga 
gggcctacga 
agttatgggg 
gtggtaaaca 
cgatgttctt 
agaaaggcac 
atcttggaag 
tcgaactgaa 
gagacctttg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

10.80 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1546 



<210> 15 
<211> 633 
<212> DNA 

<213> Megathura crenulata 



<400> 15 

tggcatcgct tcgctacact gcttttgatc 
atcgtatatg ggcaatatgg caggctttac 
ctaactgtgc tgttacatcg atgagagaac 



cactattcta cttgcatcac tctaatacag 60 
agaagtacag aggaaaaccg tacaacgttg 120 
ctttgcaacc atttggcctc tctgccaata 180 



« • » • • 
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tcaacacaga ccatgtaacc aaggagcatt cagtgccatt . caacgttttt gattacaaga 24 0 
ccaatttcaa ttatgaatat gacactttgg aatttaacgg tctctcaatc tctcagttga 3 00 
ataaaaagct cgaagcgata aagagccaag acaggttctt tgcaggcttc ctgttatctg 3 60 
gtttcaagaa atcatctctt gttaaattca atatttgcac cgatagcagc aactgtcacc 420 
ccgctggaga gttttacctt ctgggtgatg aaaacgagat gccatgggca tacgatagag 480 
tcttcaaata tgacataacc gaaaaactcc acgatctaaa gctgcatgca gaagaccact 540 
tctacattga ctatgaagta tttgacctta aaccagca'ag cctgggaaaa gatttgttca 600 
agcagccttc agtcattcat gaaccaagaa tag 633 

<210> 16 

<211> 1236 

<212> DNA 

<213> Megathura crenulata 



<400> 16 
gtcaccatga 
acattgaaaa 
aaaacgatgg 
taaatggtaa 
gactgtacgt 
Icctattggga 
actacaattc 
acgagaatga 
acgagcaggt 
agatattaca 
accttgatta 
tctgggcaat 
gcgctatcca 
aggcaacgaa 
atgcttacga 
aagaaagaaa 
ctgccgatgg 
atgaggctgg 
gactttacaa 
atttcgatct 
tccactctcc 



aggcgaagta 
tctgagcctt 
aacttacgaa 
ccccatctct 
ggttgtcgtt 
ctggacaaaa 
caggcaacat 
aatcactact 
cctttacgcc 
caatgcattg 
cgctgctttt 
ctggcaagac 
attgatgcac 
aacgcatgcc 
taatctggaa 
aaggcatgac 
ccatgtattt 
tatgttctcc 
acttgacata 
ggaaattgag 
cactatactg 



tatcaagctg 
ggtgaactcg 
tcaatagcta 
tgttgtgtcc 
gagaatgccc 
cgaatcgaac 
cactatgaga 
agggatccca 
ttggagcagg 
cattctttac 
gatcctgtgt 
cttcagaggt 
acgccactcc 
actccacatg 
ctgaatcact 
agagtattcg 
gtatgtctcc 
atcttaggcg 
actaaagcct 
attacggctg 
tttgaggccg 



aagtaacttc 
aaagtctgag 
aattccatgg 
atggcatgcc 
tcctgaaaaa 
atttacctca 
caaacccatt 
aggacagcct 
ataacttctg 
ttggtggcaa 
tcttccttca 
tccgaaaacg 
agccgtttga 
atggttttga 
actcgattcc 
ctggcttcct 
caactgggga 
gtcaaacgga 
tgaaaaagaa 
tgaatggatc 
gaacag 



tgccaaccgt 
agctgccttc 
tagccctggt 
aactttccct 
aggatcatct 
cctgatttca 
ccatcatggc 
cttccattca 
tgatttcgag 
aggtaaatat 
tcacgcaacg 
gccataccga 
taagagcgac 
atatcaaaac 
tcagcttgat 
ccttcacaat 
acacacgaag 
gatgtccttt 
cggtgtgcac 
tcatctagac 



attcgaaaaa 

ctggaaattg 

ttgtgccagt 

cactggcaca 

gtagctgttc 

gacgccactt 

aaaatcacac 

gactactttt 

attcagttgg 

tccatgtcaa 

actgacagaa 

gaagcgaatt 

aacaatgacg 

agctttggtt 

cacatgctgc 

attggaacat 

gactgcagtc 

gtatttfgaca" 

ctgcaagggg 

agtcatgtca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

108 0 

1140 

1200 

1236 




<210> 17 
,<211> 241 
212> DNA 

213 > Megathura crenulata 
<400> 17 

attctgccca cacagatgat ggacacactg aaccagtgat gattcgcaaa gatatcacac 60 
aattggacaa gcgtcaacaa ctgtcactgg tgaaagccct cgagtccatg aaagccgacc 120 
attcatctga tgggttccag gcaatcgctt ccttccatgc tcttcctcct ctttgtccat 180 
caccagctgc ttcaaagagg tttgcgtgct gcgtccatgg catgccaacc ttcccgcaat 24 0 
g 241 



<210> 18 
<211> 623 
<:212> DNA 

<213> Megathura crenulata 



<400> 18 

gcttcgctac actgcttttg atcctatatt 
ctgggccatt tggcaagctc ttcaaatcag 
ctcgtctcaa gaaagagaac cattaaagcc 
cgagaaaacg taccacaact ctgtccccac 



ttacctccat cactcaaatg ttgatcgtct 60 
gagaggcaag tcttacaagg cccactgcgc 120 
ttttgcattc agttccccac tgaacaacaa 180 
taacgtttat gactatgtgg gagttttgca 240 



ctatcgatat 
tcacaagcag 
atcagcaagc 
ttttgtagta 
tgagatcact 
tgttgagatc 
tataatcttt 



gatgaccttc 
acacaacatg 
gtagatatct 
cttggtggat 
gaggctctga 
accgatgttg 
gaacgtggtc 



• w » • • • • 
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agtttggcgg 
atagaacctt 
tcatcaatcg 
ccaaagaaat 
agacgctgaa 
atggatctcc 
atg 



tatgaccatg 
tgcaggattc 
agaaggtcat 
gaaatggggc 
tgttgcagtg 
cccatctgca 



tca^SaeTtg 
ttcctttcat 
gataaataca 
tttgatagaa 
gatgatgggt 
gatctcattc 



aggaatatat 300 
atattggaac 360 
aagtgggaag 420 
tgtacaagta 48 0 
tcagcattac 54 0 
cacctcctgc 600 
623 



<210> 19 

<211> 314 

<212> DNA 

<213> Megathura crenulata 



<400> 19 

ctgatgccaa 

tcgaagaaca 

ggggtttcca 

cggagaaaaa 

tgctgacagt 

actgggactg 



agactttggc 
aacttcgttg 
gcagattgca 
atttgcatgc 
tcaaggagaa 
gaca 



catagcagaa 
aggcgagcta 
gcattccacg 
tgtgttcatg 
aatgctctga 



aaatcaggaa 
tggcagatct 
gagaaccaaa 
gaatggctgt 
ggaaacatgg 



agacgttgat 
acaggacgac 
atggtgtcca 
tttccctcac 
ctttactggt 



tctctgacag 60 
aaaacatcag 120 
agccccgaag 18 0 
tggcacagat 24 0 
ggactgcctt 300 
314 



<210> 20 
<211> 408 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
<222> (1) . . (408) 
<223> HtH 1 Domane b 

<400> 20 

Asp His Leu Thr Arg Glu Glu Glu Tyr Glu Leu Arg Met Ala Leu Glu 
15 10 15 

Arg Phe Gin Ala Asp Thr Ser Val Asp Gly Tyr Gin Ala Thr Val Glu 
20 25 30 

^^^K*yr His Gly Leu Pro Ala Arg Cys Pro Arg Pro Asp Ala Lys Val Arg 
^^^r 35 40 . 45 

Phe Ala Cys Cys Met His Gly Met Ala Ser Phe Pro His Trp His Arg 
50 55 60 

Leu Phe Val Thr Gin Val Glu Asp Ala Leu Val Arg Arg Gly Ser Pro 
65 70 75 80 

lie Gly Val Pro Tyr Trp Asp Trp Thr Lys Pro Met Thr His Leu Pro 

85 90 95 

Asp Leu Ala Ser Asn Glu Thr Tyr Val Asp Pro Tyr Gly His Thr His 
100 105 110 

His Asn Pro Phe Phe Asn Ala Asn lie Ser Phe Glu Glu Gly His His 
115 120 125 



His Thr Ser Arg Met lie Asp Ser Lys Leu Phe Ala Pro Val Ala Phe 
130 135 140 



•••• 
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Gly Glu His Ser His Leu Phe Asp Gly lie Leu Tyr Ala Phe Glu Gin 
145 150 155 160 

Glu Asp Phe Cys Asp Phe Glu lie Gin Phe Glu Leu Val His Asn Ser 
165 170 175 

He His Ala Trp He Gly Gly Ser Glu Asp Tyr Ser Met Ala Thr Leu 
180 185 190 

His Tyr Thr Ala Phe Asp Pro He Phe Tyr Leu His His Ser Asn Val 
195 200 205 

Asp Arg Leu Trp Ala He Trp Gin Ala Leu Gin He Arg Arg His Lys 
210 215 220 



Pro Tyr Gin Ala His Cys Ala Gin Ser Val Glu Gin Leu Pro Met Lys 
225 230 235 240 



Pro Phe Ala Phe Pro Ser Pro Leu Asn Asn Asn Glu Lys Thr His Ser 
245 250 255 




His Ser Val Pro Thr Asp He Tyr Asp Tyr Glu Glu Val Leu His Tyr 
260 265 270 

Ser Tyr Asp Asp Leu Thr Phe Gly Gly Met Asn Leu Glu Glu He Glu 
275 280 285 

Glu Ala He His Leu Arg Gin Gin His Glu Arg Val Phe Ala Gly Phe 
290 295 300 

Leu Leu Ala Gly He Gly Thr Ser Ala Leu Val Asp He Phe He Asn 
305 310 315 320 

Lys Pro Gly Thr Gin Pro Leu Lys Ala Gly Asp He Ala He Leu Gly 
325 330 335 

Gly Ala Lys Glu Met Pro Trp Ala Phe Asp Arg Leu Tyr Lys Val Glu 
340 345 350 

le Thr Asp Ser Leu Lys Thr Leu Ser Leu Asp Val Asp Gly Asp Tyr 
355 360 365 

Glu Val Thr Phe Lys He His Asp Met His Gly Asn Ala Leu Asp Thr 
370 375 380 

Asp Leu He Pro His Ala Ala Val Val Ser Glu Pro Ala His Pro Thr 
385 390 395 400 

Phe Glu Asp Glu Lys His Ser Leu 
405 



<210> 21 
<211> 404 
<212> PRT 

<213> Haliotis tuberculata 



<220> 



<221> DOMAIN 
<222> (1) . . (404) 
<223> HtH 1 Domane c 



<400> 21 

Arg lie Arg Lys Asn Val Asp Ser Leu Thr Pro Glu Glu Thr Asn Glu 
15 10 15 

Leu Arg Lys Ala Leu Glu Leu Leu Glu Asn Asp His Thr Val Gly Gly 
20 25 30 

Phe Asn Gin Leu Gly Ala Phe His Gly Glu Pro Lys Trp Cys Pro Asn 
35 40 45 

Pro Glu Ala Glu His Lys Val Ala Cys Cys Val His Gly Met Ala Val 
50 55 60 



Phe Pro His Trp His Arg Leu Leu Ala Leu Gin Ala Glu Asn Ala Leu 
65 70 75 80 



rg Lys His Gly Tyr Ser Gly Ala Leu Pro Tyr Trp Asp Trp Thr Arg 
85 90 95 



Pro Leu Ser Gin Leu Pro Asp Leu Val Ser His Glu Gin Tyr Thr Asp 
100 105 110 

Pro Ser Asp His His Val Lys His Asn Pro Trp Phe Asn Gly His lie 
115 120 125 

Asp Thr Val Asn Gin Asp Thr Thr Arg Ser Val Arg Glu Asp Leu Tyr 
130 135 140 



Gin Gin Pro Glu Phe Gly His Phe Thr Asp lie Ala Gin Gin Val Leu 
14'5 150 155 160 



Leu Ala Leu Glu Gin Asp Asp Phe Cys Ser Phe Glu Val Gin Tyr Glu 
165 170 175 




lie Ser His Asn Phe lie His Ala Leu Val Gly Gly Thr Asp Ala Tyr 
180 185 190 



Gly Met Ala Ser Leu Arg Tyr Thr Ala Tyr Asp Pro lie Phe Phe Leu 
195 200 205 



His His Ser Asn Thr Asp Arg lie Trp Ala lie Trp Gin Ser Leu Gin 
210 215 220 

Lys Tyr Arg Gly Lys Pro Tyr Asn Thr Ala Asn Cys Ala lie Glu Ser 

225 230 235 240 

Met Arg Arg Pro Leu Gin Pro Phe Gly Leu Ser Ser Ala lie Asn Pro 

245 250 255 



Asp Arg lie Thr Arg Glu His Ala lie Pro Phe Asp Val Phe Asn Tyr 
260 265 270 



Arg Asp Asn Leu His Tyr Val Tyr Asp Thr Leu Glu Phe Asn Gly Leu 
275 280 285 



Ser He Ser Gin Leu Asp Arg Glu Leu Glu Lys He Lys Ser His Glu 
290 295 300 



Arq Val Phe Ala Gly Phe Leu Leu Ser Gly He Lys Lys Ser Ala Leu 
305 310 315 320 

Val Lys Phe Glu Val Cys Thr Pro Pro Asp Asn Cys His Lys Ala Gly 
325 330 335 



Glu Phe Tyr Leu Leu Gly Asp Glu Asn Glu Met Ala Trp Ala Tyr Asp 
340 345 350 

Arg Leu Phe Lys Tyr Asp He Thr Gin Val Leu Glu Ala Asn His Leu 
355 360 365 

His Phe Tyr Asp His Leu Phe He Arg Tyr Glu Val Phe Asp Leu Lys 
370 375 380 



Val Ser Leu Gly Thr Asp Leu Phe His Thr Ala Asn Val Val His 



Gly 

385 390 
Asp Ser Gly Thr 



395 400 



<210> 22 
<211> 413 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

.<221>j!QMAXN _. , - 

<222> (1) . . (413) 
<223> HtH 1 Domane d 

Gly°Thr^Arg Asp Arg Asp Asn Tyr Val Glu Glu Val Thr Gly Ala Ser 



15 10 15 

is He Arg Lys Asn Leu Asn Asp Leu Asn Thr Gly Glu Met Glu Ser 

20 25 . . 30 



Leu Arg Ala Ala Phe Leu His He Gin Asp Asp Gly Thr Tyr Glu Ser 
35 40 45 

He Ala Gin Tyr His Gly Lys Pro Gly Lys Cys Gin Leu Asn Asp His 
50 55 60 

Asn He Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin Trp His 
65 70 75 80 

Arq Leu Tyr Val Val Gin Val Glu Asn Ala Leu Leu Asn Arg Gly Ser 

85 90 95 

Gly Val Ala Val Pro Tyr Trp Glu Trp Thr Ala Pro He Asp His Leu 
100 105 110 

Pro His Phe He Asp Asp Ala Thr Tyr Phe Asn Ser Arg Gin Gin Arg 
115 120 125 




Tyr Asp Pro Asn Pro Phe Phe Arg Gly Lys Val Thr Phe Glu Asn Ala 
130 135 140 

Val Thr Thr Arg Asp Pro Gin Ala Gly Leu Phe Asn Ser Asp Tyr Met 
145 150 155 160 

Tyr Glu Asn Val Leu Leu Ala Leu Glu Gin Glu Asn Tyr Cys Asp Phe 
165 170 175 

Glu lie Gin Phe Glu Leu Val His Asn Ala Leu His Ser Met Leu Gly 
180 185 190 

Gly Lys Gly Gin Tyr Ser Met Ser Ser Leu Asp Tyr Ser Ala Phe Asp 
195 200 205 

Pro Val Phe Phe Leu His His Ala Asn Thr Asp Arg Leu Trp Ala lie 
210 215 220 

Trp Gin Glu Leu Gin Arg Phe Arg Glu Leu Pro Tyr Glu Glu Ala Asn 
225 230 235 240 

Cys Ala lie Asn Leu Met His Gin Pro Leu Lys Pro Phe Ser Asp Pro 
245 250 255 



His Glu Asn His Asp Asn Val Thr Leu Lys Tyr Ser Lys Pro Gin Asp 
260 265 270 

Gly Phe Asp Tyr Gin Asn His Phe Gly Tyr Lys Tyr Asp Asn Leu Glu 
275 280 285 

Phe His His. Leu Ser lie Pro Ser Leu Asp Ala Thr Leu Lys Gin Arg 
290 295 300 

Arg His His Asp Arg Val Phe Ala Gly Phe Leu Leu His Asn lie Gly 
305 310 315 320 

Thr Ser Ala Asp lie Thr lie Tyr lie Cys Leu Pro Asp Gly Arg Arg 
325 330 335 

ly Asn Asp Cys Ser His Glu Ala Gly Thr Phe Tyr lie Leu Gly Gly 
340 345 350 

Glu Thr Glu Met Pro Phe lie Phe Asp Arg Leu Tyr Lys Phe Glu lie 
355 360 365 

Thr Lys Pro Leu Gin Gin Leu Gly Val Lys Leu His Gly Gly Val Phe 
370 375 380 

Glu Leu Glu Leu Glu lie Lys Ala Tyr Asn Gly Ser Tyr Leu Asp Pro 
385 390 395 400 

His Thr Phe Asp Pro Thr lie lie Phe Glu Pro Gly Thr 
405 410 



<210> 23 
<211> 420 
<212> PRT 



<213> Haliotis tuberculata 



<220> 

<221> DOMAIN 
<222> (1) . . (420) 
<223> HtH 1 Domane e 

<400> 23 

Asp Thr His lie Leu Asp His Asp His Glu Glu Glu He Leu Val Arg 
15 10 15 

Lys Asn He He Asp Leu Ser Pro Arg Glu Arg Val Ser Leu Val Lys 
20 25 30 

Ala Leu Gin Arg Met Lys Asn Asp Arg Ser Ala Asp Gly Tyr Gin Ala 
35 40 45 

He Ala Ser Phe His Ala Leu Pro Pro Leu Cys Pro Asn Pro Ser Ala 
50 55 60 



'Ala His Arg Tyr Ala Cys Cys Val His Gly Met Ala Thr Phe Pro Gin 

65 70 75 80 

Trp His Arg Leu Tyr Thr Val Gin Val Gin Asp Ala Leu Arg Arg His 

85 90 95 

Gly Ser Leu Val Gly He Pro Tyr Trp Asp Trp Thr Lys Pro Val Asn 

100 105 110 

Glu Leu Pro Glu Leu Leu Ser Ser Ala Thr Phe Tyr His Pro He Arg 

115 120 125 

Asn He Asn He Ser Asn Pro Phe Leu Gly Ala Asp He Glu Phe Glu 
130 135 140 

Gly Pro Gly Val His Thr Glu Arg His He Asn Thr Glu Arg Leu Phe 

145 150 155 160 



9 



is Ser Gly Asp His Asp Gly Tyr His Asn Trp Phe Phe Glu Thr Val 
165 170 175 



Leu Phe Ala Leu Glu Gin Glu Asp Tyr Cys Asp Phe Glu He Gin Phe 
180 185 190 

Glu He Ala His Asn Gly He His Thr Trp He Gly Gly Ser Ala Val 
195 200 205 

His Gly Met Gly His Leu His Tyr Ala Ser Tyr Asp Pro He Phe Tyr 
210 215 220 

He His His Ser Gin Thr Asp Arg He Trp Ala He Trp Gin Glu Leu 
225 230 235 240 

Gin Lys Tyr Arg Gly Leu Ser Gly Ser Glu Ala Asn Cys Ala He Glu 
245 250 255 



His Met Arg Thr Pro Leu Lys Pro Phe Ser Phe Gly Pro Pro Tyr Asn 
260 265 270 



^^^^ - - .4!^^.. 



Leu Asn Ser His Tnr Gin cilu xyr ser Lys Fro Glu^sp 
275 280 285 



Tyr Lys Lys Phe Gly Tyr Arg Tyr Asp Ser Leu Glu Leu Glu Gly Arg 
290 295 300 

Ser lie Ser Arg He Asp Glu Leu lie Gin Gin Arg Gin Glu Lys Asp 
305 310 315 320 

Arg Thr Phe Ala Gly Phe Leu Leu Lys Gly Phe Gly Thr Ser Ala Ser 
325 330 335 

Val Ser Leu Gin Val Cys Arg Val Asp His Thr Cys Lys Asp Ala Gly 
340 345 350 



Tyr Phe Thr He Leu Gly Gly Ser Ala Glu Met Pro Trp Ala Phe Asp 

355 360 365 

Arg Leu Tyr Lys Tyr Asp He Thr Lys Thr Leu His Asp Met Asn Leu 
370 375 380 

Arg His Glu Asp Thr Phe Ser He Asp Val Thr He Thr Ser Tyr Asn 
385 390 395 400 



Gly Thr Val Leu Ser Gly Asp Leu He Gin Thr Pro Ser He He Phe 
405 410 415 



Val Pro Gly Arg 
420 



<210> 24 
<211> 417 
<212> PRT 

<213> Haliotis tuberculata 



<220> 

<221> DOMAIN 

•<222> (1) . . (417) 
^223 > HtH 1 Domane f 

<400> 24 

His Lys Leu Asn Ser Arg Lys His Thr Pro Asn Arg Val Arg His Glu 
15 10 15 



Leu Ser Ser Leu Ser Ser Arg Asp He Ala Ser Leu Lys Ala Ala Leu 
20 25 30 

Thr Ser Leu Gin His Asp Asn Gly Thr Asp Gly Tyr Gin Ala He Ala 
35 40 45 

Ala Phe His Gly Val Pro Ala Gin Cys His Glu Pro Ser Gly Arg Glu 
50 55 60 

He Ala Cys Cys He His Gly Met Ala Thr Phe Pro His Trp His Arg 
65 70 75 80 



Leu Tyr Thr Leu Gin Leu Glu Gin Ala Leu Arg Arg His Gly Ser Ser 

85 90 95 




Val Ala Val Pro Tyr Trp Asp Trp Thr Lys Pro lie Thr Glu Leu Pro 
100 105 110 

His lie Leu Thr Asp Gly Glu Tyr Tyr Asp Val Trp Gin Asn Ala Val 
115 120 125 

Leu Ala Asn Pro Phe Ala Arg Gly Tyr Val Lys lie Lys Asp Ala Phe 
130 135 140 

Thr Val Arg Asn Val Gin Glu Ser Leu Phe Lys Met Ser Ser Phe Gly 
145 150 155 160 

Lys His Ser Leu Leu Phe Asp Gin Ala Leu Leu Ala Leu Glu Gin Thr 
165 170 175 

Asp Tyr Cys Asp Phe Glu Val Gin Phe Glu Val Met His Asn Thr lie 
180 185 190 

His Tyr Leu Val Gly Gly Arg Gin Thr Tyr Ala Phe Ser Ser Leu Glu 
195 200 205 

Tyr Ser Ser Tyr Asp Pro He Phe Phe He His His Ser Phe Val Asp 
210 215 220 

Lys He Trp Ala Val Trp Gin Glu Leu Gin Ser Arg Arg His Leu Gin 
225 230 235 240 

Phe Arg Thr Ala Asp Cys Ala Val Gly Leu Met Gly Gin Ala Met Arg 
245 250 255 

Pro Phe Asn Lys Asp Phe Asn His Asn Ser Phe Thr Lys Lys His Ala 
260 265 270 

Val Pro Asn Thr Val Phe Asp Tyr Glu Asp Leu Gly Tyr Asn Tyr Asp 
275 280 285 



• 



Asn Leu Glu He Ser Gly Leu Asn Leu Asn Glu He Glu Ala Leu He 
290 295 300 



la Lys Arg Lys Ser His Ala Arg Val Phe Ala Gly Phe Leu Leu Phe 

305 310 315 320 

Gly Leu Gly Thr Ser Ala Asp He His Leu Glu He Cys Lys Thr Ser 

325 330 335 

Glu Asn Cys His Asp Ala Gly Val He Phe He Leu Gly Gly Ser Ala 

340 345 350 

Glu Met His Trp Ala Tyr Asn Arg Leu Tyr Lys Tyr Asp He Thr Glu 
355 360 365 

Ala Leu Gin Glu Phe Asp He Asn Pro Glu Asp Val Phe His Ala Asp 
370 375 380 

Glu Pro Phe Phe Leu Arg Leu Ser Val Val Ala Val Asn Gly Thr Val 

385 390 395 400 



He Pro Ser Ser His Leu His Gin Pro Thr He He Tyr Glu Pro Gly 




<210> 25 
<211> 403 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
<222> (1) . . (403) 
<223> HtH 1 Domane g 



<400> 25 

Asp His His Asp Asp His Gin Ser Gly Ser He Ala Gly Ser Gly Val 
15 10 15 



rg Lys Asp Val Asn Thr Leu Thr Lys Ala Glu Thr Asp Asn Leu Arg 
20 25 30 

Glu Ala Leu Trp Gly Val Met Ala Asp His Gly Pro Asn Gly Phe Gin 
35 40 45 

Ala He Ala Ala Phe His Gly Lys Pro Ala Leu Cys Pro Met Pro Asp 
50 55 60 

Gly His Asn Tyr Ser Cys Cys Thr His Gly Met Ala Thr Phe Pro His 
65 70 75 80 

Trp His Arg Leu Tyr Thr Lys Gin Met Glu Asp Ala Met Arg Ala His 

85 90 95 

Gly Ser His Val Gly Leu Pro Tyr Trp Asp Trp Thr Ala Ala Phe Thr 
100 105 110 

is Leu Pro Thr Leu Val Thr Asp Thr Asp Asn Asn Pro Phe Gin His 
115 120 125 

Gly His lie Asp Tyr Leu Asn Val Ser Thr Thr Arg Ser Pro Arg Asp 
130 135 140 

Met Leu Phe Asn Asp Pro Glu His Gly Ser Glu Ser Phe Phe Tyr Arg 
145 150 155 160 

Gin Val Leu Leu Ala Leu Glu Gin Thr Asp Phe Cys Lys Phe Glu Val 
165 170 175 

Gin Phe Glu He Thr His Asn Ala He His Ser Trp Thr Gly Gly His 
180 185 190 

Ser Pro Tyr Gly Met Ser Thr Leu Asp Phe Thr Ala Tyr Asp Pro Leu 
195 200 205 




Phe Trp Leu His His Ser Asn Thr Asp Arg He Trp Ala Val Trp Gin 
210 215 220 



Ala Leu Gin Glu 
225 

He Gin Ala Met 



His Asn Pro Val 
260 

Tyr Asn Arg Leu 
275 



Tyr Arg 
230 

Lys Thr 
245 



ft 

• • • » 
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Gly Leu 



Pro Leu 



Thr Lys Ala Asn 



Ser Phe 



Ser He Pro Glu Leu Asp 
290 




Arg He Phe Ala 
305 



Val Val Phe Asp 



Thr Phe Ala He 
340 

Arg Leu Phe Arg 
355 



Ala Phe 
310 

He Cys 
325 



Gin Tyr 
280 

Arg Val 
295 

Leu Leu 



Gin Pro 



Pro Tyr Asn His 
235 

Arg Pro Phe Ser 
250 

Ala Lys Pro Leu 
265 

Asp Asn Leu He 



Ala Asn Cys Glu 
240 

Asp Asp He Asn 
255 

Asp Val Phe Glu 
270 

Phe His Gly Tyr 
285 



Leu Glu Glu Arg Lys Glu Glu Asp 
300 



Leu Gly Gly Glu 
Tyr Asp 



Arg His Asp Ser Asp Phe 
370 

Asp His Glu Leu Pro Ser 

^3-85^ 390 



He Thr 
360 

Thr Phe 
375 

Asp Ser 



Ser Gly He Lys 
315 

Gly His Glu Cys 
330 

Leu Glu Met Pro 
345 

Lys Val Met Lys 



Arg Ser Ala Asp 
320 

Val Phe Ala Gly 
335 

Trp Ser Phe Asp 
350 

Gin Leu His Leu 
365 



Arg Val Lys He Val Gly Thr Asp 
380 



Val Lys Ala 
395 



Pro Thr He Glu Phe 
400 



Glu Pro Gly 




<210> 


26 


k211> 


511 


l212> 


PRT 


W213> 


Haliotis tuberculata 


<220> 




<221> 


DOMAIN 


<222> 


(1) . . (511) 


<223> 


HtH 1 Domane h 


<400> 


26 


Val His Arg Gly Gly Lys His 


1 


5 



10 



15 



Ala Asp Val Leu He Arg Lys Glu Val Asp Phe Leu Ser Leu Gin Glu 
20 25 30 



Ala Asn Ala He Lys Asp Ala Leu Tyr Lys Leu Gin Asn Asp Asp Ser 
35 40 45 



Lys Gly Gly Phe Glu Ala He Ala Gly Tyr His Gly Tyr Pro Asn Met 
50 55 60 
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Cys Pro Glu Arg Gly Thr Asp Lys Tyr Pro Cys Cys Val His Gly Met 

65 70 75 80 

Pro Val Phe Pro His Trp His Arg Leu His Thr lie Gin MeC Glu Arg 

85 90 95 

Ala Leu Lys Asn His Gly Ser Pro Met Gly lie Pro Tyr Trp Asp Trp 

100 105 110 

Thr Lys Lys Met Ser Ser Leu Pro Ser Phe Phe Gly Asp Ser Ser Asn 

115 120 125 

Asn Asn Pro Phe Tyr Lys Tyr Tyr lie Arg Gly Val Gin His Glu Thr 

130 135 140 

Thr Arg Asp Val Asn Gin Arg Leu Phe Asn Gin Thr Lys Phe Gly Glu 

145 150 155 160 



9 



he Asp Tyr Leu Tyr Tyr Leu Thr Leu Gin Val Leu Glu Glu Asn Ser 
165 170 175 




Tyr Cys Asp Phe Glu Val Gin Tyr Glu lie Leu His Asn Ala Val His 
180 185 190 

Ser Trp Leu Gly Gly Thr Gly Gin Tyr Ser Met Ser Thr Leu Glu Tyr 
195 200 205 

Ser Ala Phe Asp Pro Val Phe Met lie His His Ser Ser Leu Asp Arg 
210 215 220 

lie Trp lie Leu Trp Gin Lys Leu Gin Lys lie Arg Met Lys Pro Tyr 
225 230 235 240 

Tyr Ala Leu Asp Cys Ala Gly Asp Arg Leu Met Lys Asp Pro Leu His 
245 250 255 

Pro Phe Asn Tyr Glu Thr Val Asn Glu Asp Glu Phe Thr Arg lie Asn 
260 265 270 

er Phe Pro Ser lie Leu Phe Asp His Tyr Arg Phe Asn Tyr Glu Tyr 
275 280 285 

Asp Asn Met Arg lie Arg Gly Gin Asp lie His Glu Leu Glu Glu Val 
290 295 300 

lie Gin Glu Leu Arg Asn Lys Asp Arg lie Phe Ala Gly Phe Val Leu 
305 310 315 320 

Ser Gly Leu Arg lie Ser Ala Thr Val Lys Val Phe lie His Ser Lys 
325 330 335 

Asn Asp Thr Ser His Glu Glu Tyr Ala Gly Glu Phe Ala Val Leu Gly 
340 345 350 

Gly Glu Lys Glu Met Pro Trp Ala Tyr Glu Arg Met Leu Lys Leu Asp 
355 360 365 



lie Ser Asp Ala Val His Lys Leu His Val Lys Asp Glu Asp lie Arg 



370 



375 380 



Phe Arg Val Val Val Thr Ala Tyr Asn Gly Asp Val Val Thr Thr Arg 
385 . 390 395 400 

Leu Ser Gin Pro Phe He Val His Arg Pro Ala His Val Ala His Asp 
405 410 415 

He Leu Val He Pro Val Gly Ala Gly His Asp Leu Pro Pro Lys Val 
420 425 430 

val Val Lys Ser Gly Thr Lys val Glu Phe Thr Pro He Asp Ser Ser 
435 440 445 

Val Asn Lys Ala Met Val Glu Leu Gly Ser Tyr Thr Ala Met Ala Lys 
450 455 460 



CVS He Val Pro Pro Phe Ser Tyr His Gly Phe Glu Leu Asp Lys Val 

475 480 
465 470 * 



vr ser Val Asp His Gly Asp Tyr Tyr He Ala Ala Gly Thr His Ala 
^ 485 490 495 




Leu Cys Glu Gin Asn Leu Arg Leu His He His Val Glu His Glu 
500 505 510 



<210> 27 
<211> 104 
<212> PRT 

<213> Haliotis t\iberculata 
<220> 

<221> DOMAIN 

<222> (1) . . (104) 

<223> Partielle HtH 2 Domane h 

^he°PhrLeu Ser His He Gly Thr Ser Ala Asn Val Glu He He He 
1 5 10 15 

Asp His Gly Thr Leu His Thr Ser Val Gly Thr Phe Ala Val Leu Gly 
20 25 30 

Gly Glu Lys Glu Met Lys Trp Gly Phe Asp Arg Leu Tyr Lys Tyr Glu 
35 40 45 

He Thr Asp Glu Leu Arg Gin Leu Asn Leu Arg Ala Asp Asp Val Phe 
50 55 60 

Ser He Ser Val Lys Val Thr Asp Val Asp Gly Ser Glu Leu Ser Ser 
65 70 75 80 

Glu Leu He Pro Ser Ala Ala He He Phe Glu Arg Ser His He Asp 

85 90 95 



His Gin Asp Pro His His Asp Thr 
100 




9k 



<210> 28 
<211> 408 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
<222> (1) . . (408) 
<223> HtH 2 Domane c 

<400> 28 

lie lie Arg Lys Asn Val Asp Asn Leu Thr Pro Glu Glu lie Asn Ser 
15 10 15 

Leu Arg Arg Ala Met Ala Asp Leu Gin Ser Asp Lys Thr Ala Gly Gly 
20 25 30 

Phe Gin Gin lie Ala Ala Phe His Gly Glu Pro Lys Trp Cys Pro Ser 
35 40 45 

Pro Asp Ala Glu Lys Lys Phe Ser Cys Cys Val His Gly Met Ala Val 
50 55 60 

Phe Pro His Trp His Arg Leu Leu Thr Val Gin Gly Glu Asn Ala Leu 
65 70 75 80 

Arg Lys His Gly Cys Leu Gly Ala Leu Pro Tyr Trp Asp Trp Thr Arg 

85 90 95 

Pro Leu Ser His Leu Pro Asp Leu Val Leu Val Ser Ser Arg Thr Thr 
100 105 110 

Pro Met Pro Tyr Ser Thr Val Glu Ala Arg Asn Pro Trp Tyr Ser Gly 
115 120 125 

His lie Asp Thr Val Gly Val Asp Thr Thr Arg Ser Val Arg Gin Glu 
130 135 140 



u Tyr Glu Ala Pro Gly Phe Gly His Tyr Thr Gly Val Ala Lys Gin 

45 150 155 160 

Val Leu Leu Ala Leu Glu Gin Asp Asp Phe Cys Asp Phe Glu Val Gin 
165 170 175 

Phe Glu lie Ala His Asn Phe lie His Ala Leu Val Gly Gly Ser Glu 
180 185 190 

Pro Tyr Gly Met Ala Ser Leu Arg Tyr Thr Thr Tyr Asp Pro lie Phe 
195 200 205 

Tyr Leu His His Ser Asn Thr Asp Arg Leu Trp Ala lie Trp Gin Ala 
210 215 220 

Leu Gin Lys Tyr Arg Gly Lys Pro Tyr Asn Ser Ala Asn Cys Ala lie 

225 230 235 240 



Ala Ser Met Arg Lys Pro Leu Gin Pro Phe Gly Leu Thr Asp Glu lie 
245 250 255 
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Asn Pro Asp Asp Glu Thr Arg Gin His Ala Val Pro Phe Ser Val Phe 
260 265 270 

Asp Tyr Lys Asn Asn Phe Asn Tyr Glu Tyr Asp Thr Leu Asp Phe Asn 
275 280 285 

Gly Leu Ser He Ser Gin Leu Asp Arg Glu Leu Ser Arg Arg Lys Ser 
290 295 300 

His Asp Arg Val Phe Ala Gly Phe Leu Leu His Gly He Gin Gin Ser 
305 310 315 320 

Ala Leu Val Lys Phe Phe Val Cys Lys Ser Asp Asp Asp Cys Asp His 
325 330 335 

Tyr Ala Gly Glu Phe Tyr He Leu Gly Asp Glu Ala Glu Met Pro Trp 
340 345 350 

ly Tyr Asp Arg Leu Tyr Lys Tyr Glu He Thr Glu Gin Leu Asn Ala 
355 360 365 

Leu Asp Leu His He Gly Asp Arg Phe Phe He Arg Tyr Glu Ala Phe 
370 375 380 

Asp Leu His Gly Thr Ser Leu Gly Ser Asn lie Phe Pro Lys Pro Ser 
385 390 395 400 

Val He His Asp Glu Gly Ala Gly 
405 



<210> 29 

<211> 421 

<212> PRT 

<213> Haliotis tuberculata 



m 



<220> 
221 > DOMAIN 

22> (1) . . (421) 
223 > HtH 2 Domane d 



<400> 29 

His His Gin Ala Asp Glu Tyr Asp Glu Val Val Thr Ala Ala Ser His 
1 5 10 

He Arg Lys Asn Leu Lys Asp Leu Ser Lys Gly Glu Val Glu Ser Leu 
20 25 30 

Arg Ser Ala Phe Leu Gin Leu Gin Asn Asp Gly Val Tyr Glu Asn He 
35 40 45 

Ala Lys Phe His Gly Lys Pro Gly Leu Cys Asp Asp Asn Gly Arg Lys 
50 55 60 

Val Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin Trp His Arg 
65 70 75 80 



Leu Tyr Va 



1 Leu Gin Val Glu Asn Ala Leu Leu Glu Arg Gly Ser Ala 





85 90 95 

Val Ser Val Pro Tyr Trp Asp Trp Thr Glu Thr Phe Thr Glu Leu Pro 
100 105 110 

Ser Leu lie Ala Glu Ala Thr Tyr Phe Asn Ser Arg Gin Gin Thr Phe 
115 120 125 

Asp Pro Asn Pro Phe Phe Arg Gly Lys lie Ser Phe Glu Asn Ala Val 
130 135 140 

Thr Thr Arg Asp Pro Gin Pro Glu Leu Tyr Val Asn Arg Tyr Tyr Tyr 
145 150 155 160 

Gin Asn Val Met Leu Val Phe Glu Gin Asp Asn Tyr Cys Asp Phe Glu 
165 170 175 

lie Gin Phe Glu Met Val His Asn Val Leu His Ala Trp Leu Gly Gly 
180 185 190 

.rg Ala Thr Tyr Ser lie Ser Ser Leu Asp Tyr Ser Ala Phe Asp Pro 
195 200 205 

Val Phe Phe Leu His His Ala Asn Thr Asp Arg Leu Trp Ala lie Trp 
210 215 220 

Gin Glu Leu Gin Arg Tyr Arg Lys Lys Pro Tyr Asn Glu Ala Asp Cys 
225 230 235 240 

Ala lie Asn Leu Met Arg Lys Pro Leu His Pro Phe Asp Asn Ser Asp 
245 250 255 

Leu Asn His Asp Pro Val Thr Phe Lys Tyr Ser Lys Pro Thr Asp Gly 
260 265 270 

Phe Asp Tyr Gin Asn Asn Phe Gly Tyr Lys Tyr Asp Asn Leu Glu Phe 
275 280 285 

sn His Phe Ser lie Pro Arg Leu Glu Glu lie lie Arg lie Arg Gin 
290 295 300 

Arg Gin Asp Arg. Val Phe Ala Gly Phe Leu Leu His Asn lie Gly Thr 
305 310 315 320 

Ser Ala Thr Val Glu lie Phe Val Cys Val Pro Thr Thr Ser Gly Glu 
325 330 335 

Gin Asn Cys Glu Asn Lys Ala Gly Thr Phe Ala Val Leu Gly Gly Glu 
340 345 350 

Thr Glu Met Ala Phe His Phe Asp Arg Leu Tyr Arg Phe Asp lie Ser 
355 360 365 

Glu Thr Leu Arg Asp Leu Gly lie Gin Leu Asp Ser His Asp Phe Asp 
370 375 380 



Leu Ser lie Lys lie Gin Gly Val Asn Gly Ser Tyr Leu Asp Pro His 
385 390 395 400 



lie Leu Pro Glu Pro Ser Leu lie Phe Val Pro Gly Ser Ser Ser Phe 
405 410 415 



Leu Arg Pro Asp Gly 
420 





<210> 30 
<211> 410 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
<222> (1) . . (410) 
<223> HtH 2 Domane e 

<400> 30 

His Ser Asp Asp lie Leu Val Arg Lys Glu Val Asn Ser Leu Thr Thr 
15 10 15 

Arg Glu Thr Ala Ser Leu lie His Ala Leu Lys Ser Met Gin Glu Asp 
20 25 30 

His Ser Pro Asp Gly Phe Gin Ala He Ala Ser Phe His Ala Leu Pro 
35 40 45 

Pro Leu Cys Pro Ser Pro Ser Ala Ala His Arg Tyr Ala Cys Cys Val 
50 55 60 

His Gly Met Ala Thr Phe Pro Gin Trp His Arg Leu Tyr Thr Val Gin 
65 70 75 80 

Phe Gin Asp Ala Leu Arg Arg His Gly Ala Thr Val Gly Val Pro Tyr 

85 90 SS 

Trp Asp Trp Leu Arg Pro Gin Ser His Leu Pro Glu Leu Val Thr Met 
100 105 110 

lu Thr Tyr His Asp lie Trp Ser Asn Arg Asp Phe Pro Asn Pro Phe 
115 120 125 

Tyr Gin Ala Asn He Glu Phe Glu Gly Glu Asn He Thr Thr Glu Arg 
130 135 140 

Glu Val He Ala Asp Lys Leu Phe Val Lys Gly Gly His Val Phe Asp 
145 150 155 160 

Asn Trp Phe Phe Lys Gin Ala He Leu Ala Leu Glu Gin Glu Asn Tyr 
165 170 175 

Cys Asp Phe Glu He Gin Phe Glu He Leu His Asn Gly Val His Thr 
180 185 190 

Trp Val Gly Gly Ser Arg Thr Tyr Ser He Gly His Leu His Tyr Ala 
195 200 205 

Phe Tyr Asp Pro Leu Phe Tyr Leu His His Ser Gin Thr Asp Arg He 
210 215 220 
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Trp Ala lie Trp Gin Glu Leu Gin Glu Gin Arg Gly Leu Ser Gly Asp 
225 230 235 240 

Glu Ala His Cys Ala Leu Glu Gin Met Arg Glu Pro Leu Lys Pro Phe 
245 250 255 

Ser Phe Gly Ala Pro Tyr Asn Trp Asn Gin Leu Thr Gin Asp Phe Ser 
260 265 270 

Arg Pro Glu Asp Thr Phe Asp Tyr Arg Lys Phe Gly Tyr Glu Tyr Asp 
275 280 285 

Asn Leu Glu Phe Leu Gly Met Ser Val Ala Glu Leu Asp Gin Tyr lie 
290 295 300 

lie Glu His Gin Glu Asn Asp Arg Val Phe Ala Gly Phe Leu Leu Ser 
305 310 315 320 

Gly Phe Gly Gly Ser Ala Ser Val Asn Phe Gin Val Cys Arg Ala Asp 
325 330 335 

Ser Thr Cys Gin Asp Ala Gly Tyr Phe Thr Val Leu Gly Gly Ser Ala 
340 345 350 

Glu Met Ala Trp Ala Phe Asp Arg Leu Tyr Lys Tyr Asp lie Thr Glu 
355 360 365 

Thr Leu Glu Lys Met His Leu Arg Tyr Asp Asp Asp Phe Thr lie Ser 
370 375 380 

Val Ser Leu Thr Ala Asn Asn Gly Thr Val Leu Ser Ser Ser Leu lie 
385 390 395 400 

Pro Thr Pro Ser Val lie Phe Gin Arg Gly 
405 410 



<210> 


31 


^11> 


417 


H212> 


PRT 


^213> 


Haliotis tuberculata 


<220> 




<221> 


DOMAIN 


<222> 


(1) (417) 


<223> 


HtH 2 Domane f 


<400> 


31 


His Arg Asp lie Asn Thr Arg 


1 


5 



10 15 

Glu Leu Ser Asp Leu Ser Ala Arg' Asp Leu Ser Ser Leu Lys Ser Ala 
20 25 30 

Leu Arg Asp Leu Gin Glu Asp Asp Gly Pro Asn Gly Tyr Gin Ala Leu 
35 40 45 



Ala Ala Phe His Gly Leu Pro Ala Gly Cys His Asp Ser Arg Gly Asn 




Glu lie Ala Cys Cys He His Gly Met Pro Thr Phe Pro Gin Trp His 
65 70 75 80 

Arg Leu Tyr Thr Leu Gin Leu Glu Met Ala Leu Arg Arg His Gly Ser 

85 . 90 95 

Ser Val Ala He Pro Tyr Trp Asp Trp Thr Lys Pro He Ser Glu Leu 
100 105 HO 

Pro Ser Leu Phe Thr Ser Pro Glu Tyr Tyr Asp Pro Trp His Asp Ala 
115 120 125 

Val Val Asn Asn Pro Phe Ser Lys Gly Phe Val Lys Phe Ala Asn Thr 
130 135 140 

Tyr Thr Val Arg Asp Pro Gin Glu Met Leu Phe Gin Leu Cys Glu His 
145 150 155 160 

ly Glu Ser He Leu Tyr Glu Gin Thr Leu Leu Ala Leu Glu Gin Thr 
165 170 175 

Asp Tyr Cys Asp Phe Glu Val Gin Phe Glu Val Leu His Asn Val He 
180 185 190 

His Tyr Leu Val Gly Gly Arg Gin Thr Tyr Ala Leu Ser Ser Leu His 
195 200 205 

Tyr Ala Ser Tyr Asp Pro Phe Phe Phe He His His Ser Phe Val Asp 
210 215 220 

Lys Met Trp VaT Val Trp Gin Ala Leu "Gin Lys Arg Arg Lys Leu Pro 
225 230 235 240 

Tyr Lys Arg Ala Asp Cys Ala Val Asn Leu Met Thr Lys Pro Met Arg 
245 250 255 



Pro Phe Asp Ser Asp Met Asn Gin Asn Pro Phe Thr Lys Met His Ala 
260 265 270 



al Pro Asn Thr Leu Tyr Asp Tyr Glu Thr Leu Tyr Tyr Ser Tyr Asp 
275 280 285 

Asn Leu Glu He Gly Gly Arg Asn Leu Asp Gin Leu Gin Ala Glu He 
290 295 300 

Asp Arg Ser Arg Ser His Asp Arg Val Phe Ala Gly Phe Leu Leu Arg 
305 310 315 320 

Gly He Gly Thr Ser Ala Asp Val Arg Phe Trp He Cys Arg Asn Glu 
325 330 335 

Asn Asp Cys His Arg Gly Gly He He Phe He Leu Gly Gly Ala Lys 
340 345 350 

Glu Met Pro Trp Ser Phe Asp Arg Asn Phe Lys Phe Asp He Thr His 
355 " 360 365 
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vcix ucu Asn iwc ±±Q iser iTO (jiu Asp vaX""=«ie^*K:sp Ala Glu 

370 375 380 




Glu Pro Phe Tyr He Lys Val Glu He His Ala Val Asn Lys Thr Met 
385 390 395 400 

He Pro Ser Ser Val He Pro Ala Pro Thr He He Tyr Ser Pro Gly 
405 410 415 



Glu 




<210> 32 
<211> 403 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
222> (1) . . (403) 
223 > HtH 2 Domane g 

<400> 32 

Gly Arg Ala Ala Asp Ser Ala His Ser Ala Asn He Ala Gly Ser Gly 
15 10 15 

Val Arg Lys Asp Val Thr Thr Leu Thr Val Ser Glu Thr Glu Asn Leu 
20 25 30 

Arg Gin Ala Leu Gin Gly Val He Asp Asp Thr Gly Pro Asn Gly Tyr 
35 40 45 

Gin Ala He Ala Ser Phe His Gly Ser Pro Pro Met Cys Glu Met Asn 
50 55 60 

Gly Arg Lys Gly Ala Cys Cys Ala His Gly Met Ala Ser Phe Pro His 
^5 70 75 80 



p His Arg Leu Tyr Val Lys Gin Met Glu Asp Ala Leu Ala Asp His 
85 90 95 



Gly Ser His He Gly He Pro Tyr Trp Asp Trp Thr Thr Ala Phe Thr 
100 105 110 

Glu Leu Pro Ala Leu Val Thr Asp Ser Glu Asn Asn Pro Phe His Glu 
115 120 125 

Gly Arg He Asp His Leu Gly Val Thr Thr Ser Arg Ser Pro Arg Asp 
130 135 140 

Met Leu Phe Asn Asp Pro Glu Gin Gly Ser Glu Ser Phe Phe Tyr Arg 
145 150 155 160 

Gin Val Leu Leu Ala Leu Glu Gin Thr Asp Tyr Cys Gin Phe Glu Val 
165 170 175 

Gin Phe Glu Leu Thr His Asn Ala He His Ser Trp Thr Gly Gly Arg 
180 185 190 
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Ser Pro Tyr Gly Met Ser Thr Leu Glu Phe Thr Ala Tyr Asp Pro Leu 
195 200 205 

Phe Trp Leu His His Ser Asn Thr Asp Arg lie Trp Ala Val Trp Gin 
210 215 220 

Ala Leu Gin Lys Tyr Arg Gly Leu Pro Tyr Asn Glu Ala His Cys Glu 
225 230 235 240 

lie Gin Val Leu Lys Gin Pro Leu Arg Pro Phe Asn Asp Asp lie Asn 
245 250 255 

His Asn Pro lie Thr Lys Thr Asn Ala Arg Pro lie Asp Ser Phe Asp 
260 265 270 

Tyr Glu Arg Phe Asn Tyr Gin Tyr Asp Thr Leu Ser Phe His Gly Lys 
275 280 285 

Ser lie Pro Glu Leu Asn Asp Leu Leu Glu Glu Arg Lys Arg Glu Glu 
290 295 300 

Arg Thr Phe Ala Ala Phe Leu Leu Arg Gly lie Gly Cys Ser Ala Asp 
305 310 315 320 

Val Val Phe Asp lie Cys Arg Pro Asn Gly Asp Cys Val Phe Ala Gly 
325 330 335 

Thr Phe Ala Val Leu Gly Gly Glu Leu Glu Met Pro Trp Ser Phe Asp 
340 345 350 

Arg Leu Phe Arg Tyr Asp lie Thr Arg Val Met Asn Gin Leu His Leu 
355 360 365 

Gin Tyr Asp Ser Asp Phe Ser Phe Arg Val Lys Leu Val Ala Thr Asn 
370 " 375 380 

Gly Thr Glu Leu Ser Ser Asp Leu Leu Lys Ser Pro Thr lie Glu His 
385 390 395 400 

lu Leu Gly 



<210> 33 
<211> 511 
<212> PRT 

<213> Haliotis tuberculata 
<220> 

<221> DOMAIN 
<222> (1) . . (511) 
<223> HtH 2 Domane h 

<400> 33 

Ala His Arg Gly Pro Val Glu Glu Thr Glu Val Thr Arg Gin His Thr 
15 10 15 



Asp Gly Asn Ala His Phe His Arg Lys Glu Val Asp Ser Leu Ser Leu 
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Asp Glu Ala Asn Asn Leu Lys Asn Ala Leu Tyr Lys Leu Gin Asn Asp 
35 40 45 

His Ser Leu Thr Gly Tyr Glu Ala lie Ser Gly Tyr His Gly Tyr Pro 
50 55 60 

Asn Leu Cys Pro Glu Glu Gly Asp Asp Lys lie Pro Cys Cys Val His 
65 70 75 80 

Gly Met Gly lie Phe Pro Tyr Trp His Arg Leu Leu Thr lie Gin Leu 

85 90 95 

Glu Arg Ala Leu Glu His Asn Gly Ala Leu Leu Gly Val Pro Tyr Trp 
100 105 110 

Asp Trp Asn Lys Asp Leu Ser Ser Leu Pro Ala Phe Phe Ser Asp Ser 
115 120 125 

er Asn Asn Asn Pro Tyr Phe Lys Tyr His lie Ala Gly Val Gly His 
130 135 140 

Asp Thr Val Arg Glu Pro Thr Ser Leu lie Tyr Asn Gin Pro Gin lie 
145 150 155 160 

His Gly Tyr Asp Tyr Leu Tyr Tyr Leu Ala Leu Thr Thr Leu Glu Glu 
165 170 175 

Asn Asn Tyr Cys Asp Phe Glu Val Gin Tyr Glu lie Leu His Asn Ala 
180 185 190 

Val His Ser Trp Leu Gly Gly Ser Gin Lys Tyr Ser Met Ser Thr Leu 
195 200 205 

Glu Tyr Ser Ala Phe Asp Pro Val Phe Met lie Leu His Ser Gly Leu 
210 215 220 



Asp Arg Leu Trp lie lie Trp Gin Glu Leu Gin Lys lie Arg Arg Lys 
"5 230 235 240 



ro Tyr Asn Phe Ala Lys Cys Ala Tyr His Met Met Glu Glu Pro Leu 
245 250 255 

Ala Pro Phe Ser Tyr Pro Ser lie Asn Gin Asp Glu Phe Thr Arg Ala 
260 265 270 

Asn Ser Lys Pro Ser Thr Val Phe Asp Gin His Lys Phe Gly Tyr His 
275 280 285 

Tyr Asp Asn Leu Asn Val Arg Gly His Ser lie Gin Glu Leu Asn Thr 
290 295 300 

lie lie Asn Asp Leu Arg Asn Thr Asp Arg lie Tyr Ala Gly Phe Val 

310 315 320 

Leu Ser Gly lie Gly Thr Ser Ala Ser Val Lys He Tyr Leu Arg Thr 
325 330 335 




• • • • • • • • • 
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Asp Asp Asn Asp Glu Glu Val Gly Thr Phe Thr Val Leu Gly Gly Glu 
340 345 350 

Arg Glu Met Pro Trp Ala Tyr Glu Arg Val Phe Lys Tyr Asp lie Thr 
355 360 365 

Glu Val Ala Asp Arg Leu Lys Leu Ser Tyr Gly Asp Thr Phe Asn Phe 
370 375 380 

Arg Leu Glu lie Thr Ser Tyr Asp Gly Ser Val Val Asn Lys Ser Leu 
385 390 395 400 

Pro Asn Pro Phe lie lie Tyr Arg Pro Ala Asn His Asp Tyr Asp Val 
405 410 415 

Leu Val lie Pro Val Gly Arg Asn Leu His lie Pro Pro Lys Val Val 
420 425 430 



Val Lys Lys Gly Thr Arg lie Glu Phe His Pro Val Asp Asp Ser Val 
435 440 445 



hr Arg Pro Val Val Asp Leu Gly Ser Tyr Thr Ala Leu Phe Asn Cys 
450 455 460 

Val Val Pro Pro Phe Thr Tyr His Gly Phe Glu Leu Asn His Val Tyr 
465 470 475 480 

Ser Val Lys Pro Gly Asp Tyr Tyr Val Thr Gly Pro Thr Arg Asp Leu 
485 490 495 

Cys Gin Asn Ala Asp Val Arg lie His lie His Val Glu Asp Glu 
500 505 510 




<210> 34 

<211> 210 

<212> PRT 

<213> Megathura crenulata 
22 0> 

221 > DOMAIN 

<222> (1) . . (210) 

<223> partielle KLH 1 Domane c 

<400> 34 

Ala Ser Leu Arg Tyr Thr Ala Phe Asp Pro Leu Phe Tyr Leu His His 
15 10 15 

Ser Asn Thr Asp Arg lie Trp Ala lie Trp Gin Ala Leu Gin Lys Tyr 
20 25 30 

Arg Gly Lys Pro Tyr Asn Val Ala Asn Cys Ala Val Thr Ser Met Arg 
35 40 45 

Glu Pro Leu Gin Pro Phe Gly Leu Ser Ala Asn lie Asn Thr Asp His 
50 55 60 



Val Thr Lys Glu His Ser Val Pro Phe Asn Val Phe Asp Tyr Lys Thr 
65 70 75 80 




Asn Phe Asn Tyr Glu Tyr Asp Thr Leu Glu Phe Asn Gly Leu Ser lie 

85 90 95 

Ser Gin Leu Asn Lys Lys Leu Glu Ala lie Lys Ser Gin Asp Arg Phe 
100 105 110 

Phe Ala Gly Phe Leu Leu Ser Gly Phe Lys Lys Ser Ser Leu Val Lys 
■115 120 125 

Phe Asn lie Cys Thr Asp Ser Ser Asn Cys His Pro Ala Gly Glu Phe 
130 135 140 

Tyr Leu Leu Gly Asp Glu Asn Glu Met Pro Trp Ala Tyr Asp Arg Val 
145 150 155 160 

Phe Lys Tyr Asp lie Thr Glu Lys Leu His Asp Leu Lys Leu His Ala 
165 170 175 

plu Asp His Phe Tyr lie Asp Tyr Glu Val Phe Asp Leu Lys Pro Ala 
180 185 190 

Ser Leu Gly Lys Asp Leu Phe Lys Gin Pro Ser Val lie His Glu Pro 
195 " 200 205 

Arg lie 
210 



<210> 35 
<211> 411 
<212> PRT 

<213> Megathura crenulata 



<220> 

<221> DOMAIN 
<222> (1) . . (411) 
<223> KLH 1 Domane d 



00> 35 

y His His Glu Gly Glu Val Tyr Gin Ala Glu Val Thr Ser Ala Asn 
15 10 15 



Arg lie Arg Lys Asn lie Glu Asn Leu Ser Leu Gly Glu Leu Glu Ser 
20 25 30 

Leu Arg Ala Ala Phe Leu Glu lie Glu Asn Asp Gly Thr Tyr Glu Ser 
35 40 45 

lie Ala Lys Phe His Gly Ser Pro Gly Leu Cys Gin Leu Asn Gly Asn 
50 55 60 

Pro lie Ser Cys Cys Val His Gly Met Pro Thr Phe Pro His Trp His 
65 70 75 80 

Arg Leu Tyr Val Val Val Val Glu Asn Ala Leu Leu Lys Lys Gly Ser 

85 90 95 



Ser Val Ala Val Pro Tyr Trp Asp Trp Thr Lys Arg lie Glu His Leu 





100 105 110 

Pro His Leu lie Ser Asp Ala Thr Tyr Tyr Asn Ser Arg Gin His His 
115 120 125 

Tyr Glu Thr Asn Pro Phe His His Gly Lys lie Thr His Glu Asn Glu 
130 135 140 

lie Thr Thr Arg Asp Pro Lys Asp Ser Leu Phe His Ser Asp Tyr Phe 
145 150 155 160 

Tyr Glu Gin Val Leu Tyr Ala Leu Glu Gin Asp Asn Phe Cys Asp Phe 
165 170 175 

Glu lie Gin Leu Glu lie Leu His Asn Ala Leu His Ser Leu Leu Gly 
180 185 190 

Gly Lys Gly Lys Tyr Ser Met Ser Asn Leu Asp Tyr Ala Ala Phe Asp 
195 200 205 

ro Val Phe Phe Leu His His Ala Thr Thr Asp Arg lie Trp Ala lie 
210 215 220 

Trp Gin Asp Leu Gin Arg Phe Arg Lys Arg Pro Tyr Arg Glu Ala Asn 
225 230 235 240 

Cys Ala lie Gin Leu Met His Thr Pro Leu Gin Pro Phe Asp Lys Ser 
245 250 255 

Asp Asn Asn Asp Glu Ala Thr Lys Thr His Ala Thr Pro His Asp Gly 
260 265 270 

Phe Glu Tyr Gin Asn Ser Phe Gly Tyr Ala Tyr Asp Asn Leu Glu Leu 
275 280 285 

Asn His Tyr Ser lie Pro Gin Leu Asp His Met Leu Gin Glu Arg Lys 
290 295 300 



^rg His Asp Arg Val Phe Ala Gly Phe Leu Leu His Asn lie Gly Thr 
5 310 315 320 



er Ala Asp Gly His Val Phe Val Cys Leu Pro Thr Gly Glu His Thr 
325 330 335 

Lys Asp Cys Ser His Glu Ala Gly Met Phe Ser lie Leu Gly Gly Gin 
340 345 350 

Thr Glu Met Ser Phe Val Phe Asp Arg Leu Tyr Lys Leu Asp lie Thr 
355 360 365 

Lys Ala Leu Lys Lys Asn Gly Val His Leu Gin Gly Asp Phe Asp Leu 
370 375 380 

Glu lie Glu lie Thr Ala Val Asn Gly Ser His Leu Asp Ser His Val 
385 390 395 400 



lie His Ser Pro Thr lie Leu Phe Glu Ala Gly 
405 410 



• • •••« •••• 



<210> 36 
<211> 80 
<212> PRT 

<213> Megathura crenulata 
<220> 

<221> DOMAIN 
<222> (1) . . (80) 

<223> partielle KLH 1 Domane e 
<400> 36 

Asp Ser Ala His Thr Asp Asp Gly His Thr Glu Pro Val Met lie Arg 
1 5 10 15 

Lys Asp lie Thr Gin Leu Asp Lys Arg Gin Gin Leu Ser Leu Val Lys 
20 25 30 



Ala Leu Glu Ser Met Lys Ala Asp His Ser Ser Asp Gly Phe Gin Ala 
35 40 45 



le Ala Ser Phe His Ala Leu Pro Pro Leu Cys Pro Ser Pro Ala Ala 
50 55 60 



Ser Lys Arg Phe Ala Cys Cys Val His Gly Met Pro Thr Phe Pro Gin 
65 70 75 80 



<210> 37 

<211> 207 

<212> PRT 

<213> Megathura crenulata 
<220> 

<221> DOMAIN 

<222> (1) . . (207) 

<223> KLH2 Domane b 



00> 37 

eu Arg Tyr Thr Ala Phe Asp Pro lie Phe Tyr Leu His His Ser Asn 
1 5 10 15 

Val Asp Arg Leu Trp Ala lie Trp Gin Ala Leu Gin lie Arg Arg Gly 
20 25 30 

Lys Ser Tyr Lys Ala His Cys Ala Ser Ser Gin Glu Arg Glu Pro Leu 
35 40 45 

Lys Pro Phe Ala Phe Ser Ser Pro Leu Asn Asn Asn Glu Lys Thr Tyr 
50 55 60 

His Asn Ser Val Pro Thr Asn Val Tyr Asp Tyr Val Gly Val Leu His 
65 70 75 80 



Tyr Arg Tyr Asp Asp Leu Gin Phe Gly Gly Met Thr Met Ser Glu Leu 

85 90 95 




• • • «A • • • • • 
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Glu Glu Tyr lie His Lys Gin Thr Gin His Asp Arg Thr Phe Ala Gly 
100 105 110 

Phe Phe Leu Ser Tyr lie Gly Thr Ser Ala Ser Val Asp lie Phe lie 
115 120 125 

Asn Arg Glu Gly His Asp Lys Tyr Lys Val Gly Ser Phe Val Val Leu 
130 135 140 

Gly Gly Ser Lys Glu Met Lys Trp Gly Phe Asp Arg Met Tyr Lys Tyr 
145 150 155 160 

Glu lie Thr Glu Ala Leu Lys Thr Leu Asn Val Ala Val Asp Asp Gly 
165 170 175 

Phe Ser He Thr Val Glu lie Thr Asp Val Asp Gly Ser Pro Pro Ser 
180 185 190 

Ala Asp Leu He Pro Pro Pro Ala He lie Phe Glu Arg Gly His 

200 205 



) 


195 


<210> 


38 


<211> 


105 


<212> 


PRT 


<213> 


Megathura crenulata 


<220> 




<221> 


DOMAIN 


<222> 


(1) . . (105) 


<223> 


KLH2 Domane c 


<400> 


38 


Ala Asp Ala Lys Asp Phe Gly 


1 


5 



10 15 

Asp Ser Leu Thr Val Glu Glu Gin Thr Ser Leu Arg Arg Ala Met Ala 
20 25 30 



p Leu Gin Asp Asp Lys Thr Ser Gly Gly Phe Gin. Gin He Ala Ala 
35 40 45 



Phe His Gly Glu Pro Lys Trp Cys Pro Ser Pro Glu Ala Glu Lys Lys 
50 55 60 

Phe Ala Cys Cys Val His Gly Met Ala Val Phe Pro His Trp His Arg 
65 70 75 80 

Leu Leu Thr Val Gin Gly Glu Asn Ala Leu Arg Lys His Gly Phe Thr 

85 90 95 



Gly Gly Leu Pro Tyr Trp Asp Trp Thr 
100 105 



Patentanspriiche 



1. NukleinsSure-Molekul, umfassend eine furein Hamocyanin, eine Hamocyanin- 
DomSne oder ein funktionelles Fragment davon mit den immunologischen Eigenschaf- 
ten wenigstens einer DomSne eines Hamocyanins kodierende Nukleins^uresequenz, 
wobei die Nukleinsauresequenz ausgewahit ist aus 

(a) der Gruppe der nachfolgend angegebenen DNA-Sequenzen bzw. der ihnen ent- 
sprechenden RNA-Sequenzen: 

in SEQ ID NO:1 (HtH1 Domane b), 

SEQ ID NO:2 (HtH1 Domane c). 

SEQ ID NO:3 (HtHI Domane d). 

SEQ ID NO:4 (HtH1 Domane e). 

SEQ ID NO:5 (HtH1 Domane f), 

SEQ ID NO:6 (HtHI Domane g), 

SEQ ID NO:7 (HtH1 Domane h). 

SEQ ID NO:8 (partielle HtH2 Domane b), 

SEQ ID NO:9 (HtH2 Domane c). 

SEQ ID NO:10 (HtH2 Domane d), 

SEQ ID NO:11 (HtH2 Domane e), 

SEQ ID NO:12 (HtH2 Domane f). 

SEQ ID NO:13 (HtH2 Domane g), 

SEQ ID NO:14 (HtH2 Domane h). 

SEQ ID NO:15 (partielle KLH1 Domane c). 

SEQ ID NO:16 (KLH1 DomSne d), 

SEQ ID N0:17 (partielle KLH1 Domane e). 

SEQ ID NO:18 (KLH2 Domane b), 

SEQ ID NO:19 (KLH2 Domane c), 

(b) Nukleinsauresequenzen. die mit dem Gegenstrang einer Nukleinsauresequenz 
nach (a) hybridisieren und fur ein Polypeptid kodieren, das die immunologischen Ei- 
genschaften wenigstens einer Domane eines Hamocyanins aufweist; 



(c) Nukleinsauresequenzen, die aufgrund des genetischen Codes zu den unter (a) und 
(b) definierten DNA-Sequenzen degeneriert sind und fur ein Polypeptid kodieren, 
das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 

(d) NukleinsSuresequenzen, die mit einer der unter (a) bis (c) angegebenen Nuklein- 
sauresequenzen hybridisieren und deren Gegenstrang fur ein Polypeptid kodiert, 
das die immunologischen Eigenschaften wenigstens einer Domane eines Ha- 
mocyanins aufweist; 

,(e) Nukleinsauresequenzen, die wenigstens 60 % homolog zu einer der unter (a) ange- 
gebenen Nukieinsauresequenzen sind; 

(f) Varianten der unter (a) bis (d) angegebenen Sequenzen, wobei die Varianten ge- 
genuber den unter (a) bis (d) angegebenen Sequenzen Additionen, Deletionen, In- 
sertionen Oder Inversionen aufweisen und fur ein Polypeptid kodieren, das die im- 
munologischen Eigenschaften wenigstens einer Domane von Hamocyanin aufweist; 

und - ' " 

(g) Kombinationen mehrerer der unter (a) bis (f) angegebenen DNA-Sequenzen. 

2. Nukieinsauremolekul gemaft Anspruch 1, dadurch gekennzeichnet. da(i die unter 
\b) Oder (d) angegebene Hybridisierung unter stringenten Bedingungen durchgefuhrt 
wird. 

3. Nukieinsauremolekul gemaii Anspruch 1, dadurch gekennzeichnet, dad das unter 

(e) angegebene Nukieinsauremolekul wenigstens 80 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 

4. Nukieinsauremolekul gemafi Anspruch 1, dadurch gekennzeichnet, dafJ das unter 
(e) angegebene Nukieinsauremolekul wenigstens 90 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 



5. Nukleinsauremolekul gemafi Anspruch 1, dadurch gekennzeichnet. daft das unter 
(e) angegebene Nukleinsauremolekul wenigstens 95 % homolog zu einer der unter (a) 
angegebenen Nukleinsauresequenzen ist. 

6. Nukleinsauremolekul gemaR einem der Anspruche 1 bis 5, dadurch gekennzeich- 
net, dad es ein Desoxyribonukleinsauremolekui ist. 

7. Konstrukt, umfassend ein Nukleinsauremolekul gemafS einem der Anspruche 1 bis 6. 

^8. Konstrukt gemafi Anspruch 7, weiterhin umfassend einen zur Expressionskontrolle 
■geeigneten Promotor, wobei die fur ein Hamocyanin, eine Hamocyanin-Domane oder 

ein funktionelles Fragment davon kodierende Nukleinsauresequenz unter der Kontrolle 

des Promoters steht. 

9. Konstrukt gemalS Anspruch 7 oder 8, weiterhin umfassend eine fur ein Antigen kodie- 
rende Nukleinsauresequenz, die direkt mit der fur ein Hamocyanin, eine Hamocyanin- 
Domane oder ein funktionelles Fragment davon kodierenden Nukleinsauresequenz ver- 
bunden ist 

10. Konstrukt gema(J Anspruch 9, wobei das Antigen ausgewahit ist aus; Tumorantige- 
^en, Virusantigenen und Antigenen bakterieller oder parasitarer Pathogene. 

11. Konstrukt gemad einem der Anspruche 7 bis 10. wobei das Konstrukt wenigstens 
einen Teil eines Vektors enthalt. wobei der Vektor ausgewahit ist aus: Bakteriophagen, 
Adenoviren, Vacciniaviren, Baculoviren, SV40-Virus und Retroviren. 

12. Konstrukt gemafi einem der Anspruche 7 bis 1 1 . wobei das Konstrukt weiterhin eine 
His-Tag-kodierende Nukleinsauresequenz umfafJt und die Expression des Konstrukts 
zur Bildung eines Fusionsproteins mit einem His-Tag fuhrt. 



13. Wirtszelle, enthaltend ein Konstrukt gemaS einem der Anspruche 7 bis 12, wobei die 
Wirtszelle eine zur Expression des Konstrukts geeignete prokaryontische Oder eu- 
karyontische Zelle ist. 

14. Wirtszelle gemaB Anspruch 13, dadurch gekennzelchnet, dafS die prokaryontische 
Wirtszelle ausgewahit ist aus E. coil und Bacillus subtilis . 

15. Wirtszelle gemafJ Anspruch 13. dadurch gekennzeichnet, daft die eukaryontische 
Wirtszelle ausgewahit ist aus Hefezellen, Insektenzellen und Saugerzellen, bevorzugt 
aus CHO-Zellen, COS-Zellen und HeLa-Zellen. 

16. Verfahren zum Herstellen eines Hamocyanin-Polypeptides, wobei das Nukleinsau- 
remolekul gemafS einem der Anspruche 1 bis 6 und/oder das Konstrukt gemaS einem 
der Anspruche 7 bis 12 in einer geeigneten Wirtszelle exprimiert wird und das Protein 
gegebenenfalls isoliert wird. 

17. Verfahren gema(i Anspruch 16, dadurch gekennzeichnet, dafl das hergestellte 
Hamocyanin-Polypeptid naturlich Oder chemisch modifiziert wird. 

18. Verfahren gemafi Anspruch 17, dadurch gekennzeichnet, dafi die Modifikation ei- 
ne Quervernetzung Oder eine kovalente Bindung an ein Antigen ist. 

19. Verfahren gemad einem der Anspruche 16 bis 18, dadurch gekennzeichnet, 6aQ> 
die Expression in einer Wirtszelle gemaS einem der Anspruche 13 bis 15 durchgefuhrt 
wird. 

20. Hamocyanin-Polypeptid. umfassend eine Aminosauresequenz, die von einem Oder 
mehreren der Nukleinsauremolekule nach einem der Anspruche 1 bis 6 kodiert wird. 

21. Hamocyanin-Polypeptid gemafi Anspruch 20, umfassend wenigstens eine aus der 
folgenden Gruppe ausgewahlte Aminosauresequenz: 

SEQ ID NO:20 (HtH1 Domane b). 






SEQ ID N0:21 (HtHI Domane c). 
SEQ ID NO;22 (HtHI Domane d), 
SEQ ID NO:23 (HtHI Domane e). 
SEQ ID NO:24 (HtHI Domane f), 
SEQ ID NO:25 (HtHI Domane g), 
SEQ ID NO:26 (HtH1 Domane h), 
SEQ ID NO:27 (partielle HtH2 Domane b), 
SEQ ID NO:28 (HtH2 Domane c). 
SEQ ID NO:29 (HtH2 Domane d), 
SEQ ID NO:30 (HtH2 Domane e), 
SEQ ID NO:31 (HtH2 Domane f), 
SEQ ID NO:32 (HtH2 Domane g). 
SEQ ID NO:33 (HtH2 Domane h). 
SEQ ID NO:34 (partielle KLH1 Domane c). 
SEQ ID NO:35 (KLH1 Domane d). 
SEQ ID NO:36 (partielle KLH1 Domane e), 
SEQ ID NO:37 (KLH2 Domane b). 
SEQ ID NO:38 (KLH2 Domane c). 

Oder ein Fragment einer dieser Sequenzen, das die immunoiogischen Eigenschaften 
wenigstens einer Domane eines Hamocyanins aufweist. 

2. Rekombinantes Hamocyanin-Poiypeptid, erhaltlich durch das Verfahren gemSfS ei 
nem der Anspruche 16 bis 19 oder Modifikationen davon. 



23. Rekombinantes Hamocyanin-Poiypeptid gemaiS Anspruch 22, dadurch gekenn- 
zeichnet, daft es die Sequenzen SEQ ID NO: 20, 21, 22, 23, 24, 25, und 26 umfafSt und 
Hamocyanin 1 aus Haliotis tuberculata ist. 

24. Rekombinantes Hamocyanin-Poiypeptid gemali Anspruch 22, dadurch gekenn- 
zeichnet, daft es die Sequenzen SEQ ID NO: 27, 28, 29, 30, 31 , 32 und 33 umfaftt und 
Hamocyanin 2 aus Haliotis tuberculata ist. 
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25. Rekombinantes Hamocyanin-Polypeptid gemaS Anspruch 23, dadurch gekenn- 
zeichnet, dafS es ein scheinbares Molekulargewicht von 370 KDa in SDS-PAGE unter 
reduzierenden Bedingungen aufweist. 



26. Rekombinantes Hamocyanin-Polypeptid gemafS Anspruch 24, dadurch gekenn- 
zeichnet. dafi es ein scheinbares IVIolekuiargewicht von 370 KDa in SDS-PAGE unter 
reduzierenden Bedingungen aufweist. 




27. Rekombinantes Hamocyanin-Polypeptid gemafi Anspruch 21, dadurch gekenn- 
zeichnet, daH das Hamocyanin-Polypeptid die Sequenzen SEQ ID NO: 34. 35 und 36 
umfaSt und KLH1 aus Megathura crenulata ist. 

28. Rekombinantes Hamocyanin-Polypeptid gemaS' Anspruch 21. dadurch gekenn- 
zeichnet, daB das Hamocyanin-Polypeptid die Sequenzen SEQ ID NO: 37 und 38 
umfafit und KLH2 aus Megathura crenulata ist. 

29. Rekombinantes Hamocyanin-Polypeptid gemafi einem der Anspruche 20 bis 28, 
dadurch gekennzeichnet, dafi es kovalent an Viren, Virenbestandteile, Bakterien, 
Bakterienbestandteile, DNA, DNA-Bestandteile, anorganische Oder organische Molekule 
wie z. B. Kohlenhydrate Peptide und/oder Glykoproteine gebunden ist. 



50. Rekombinantes Hamocyanin-Polypeptid gemafi einem der Anspruche 20 bis 29, 
dadurch gekennzeichnet, dafl das Hamocyanin-Polypeptid nicht-glykosyliert ist. 

31. Rekombinantes Hamocyanin-Polypeptid gemafl einem der Anspruche 20 bis 29, 
dadurch gekennzeichnet, dafi das Hamocyanin-Polypeptid glykosyliert ist 

32. Pharmazeutische Zusammensetzung, enthaltend ein Nukleinsauremolekul gemad 
einem der Anspruche 1 bis 6 und/oder ein Konstrukt gemaU einem der Anspruche 7 bis 
12 und physiologisch vertragliche Zusatzmittel. 
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33. Pharmazeutische Zusammensetzung gemafl Anspruch 32, dadurch gekennzeich- 
net, dafl sie zur gentherapeutischen Behandlung von Tumoren verwendet wird. 

34. Pharmazeutische Zusammensetzung, enthaltend ein Hamocyanin-Polypeptid nach 
einem der Anspruche 20 bis 31 und physiologisch vertragliche ZusatzmitteL 

35. Pharmazeutische Zusammensetzung gemafi Anspruch 34, dadurch gekennzeich- 
net, dafS sie als Antiparasitenmittei. Antivirusmitte! Oder als Antitumormittel venA/endet 
wird. 

^^^^36. Pharmazeutische Zusammensetzung nach Anspruch 34, dadurch gekennzeichnet, 

dafi sie zum Behandein einer der folgenden Erkrankungen verwendet wird: Schistoso- 
miasis, Bluthochdruck, Oberflachen-Harnblasenkarzinomen, Epitheikarzinomen, Ovari- 
alkarzinom, Mammakarzinom, Bronchialkarzinom und Kolonrektalkarzinom. 

37. Pharmazeutische Zusammensetzung nach Anspruch 34, dadurch gekennzeichnet, 
dafi sie als impfstoff verwendet wird. 

38. Pharmazeutische Zusammensetzung gemafi Anspruch 34, dadurch gekennzeich- 
net, dafS sie zur Kokain-Mifibrauchsvorsorge verwendet wird. 

•9. Verwendung von Hamocyanin-Polypeptid gemafi einem der Anspnjche 20 bis 31 als 
ragerstoff fur Arzneimittel. 

40. Liposom, umfassend ein Nukleinsauremolekul gemafS einem der Anspruche 1 bis 6, 
ein Konstrukt gemad einem der Anspruche 7 bis 12 und/oder ein Hamocyanin- 
Polypeptid gemad einem der Anspruche 20 bis 31. 

41. Liposom gemaU Anspruch 40, dadurch gekennzeichnet, dafi das Liposom weiter- 
hin Zellerkennungsmolekule umfafit. 

42. Antikorper, erhaltlich durch Immunisieren eines Versuchstieres mit dem rekombinan- 
ten Hamocyanin-Polypeptid gemafJ einem der Anspruche 20 bis 31. 
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43. Screening-Verfahren zum Identifizieren von Tumor-spezifischer DNA in einer Zelle 
umfassend: 

a) das Inkontaktbringen zellularer DNA und/oder zelluiaren Proteins mit einer Sonde 
umfassend die Nukleinsauresequenz gema(i einem der Anspruche 1 bis 6 und/oder 
des Antikorpers genaa(i Anspruch 42 und 

b) das Nachweisen der spezifischen Bindung. 



44. Screening-Verfahren gemaS Anspruch 43, dadurch gekennzeichnet, da(i der 
nachzuweisende Tumor Hamblasenkarzinom, Epithelialkarzinom, Ovarialkarzinom, 
Mammakarzinom, Bronchialkarzinom oder Kolonrektalkarzinom ist. 



Zusammenfassung 



Nukleinsauremolekul, umfassend eine fur ein 
Hamocyanin kodierende Nukleinsauresequenz 

Die vorliegende Erfindung betrifft ein Nukleinsauremolekul, unnfassend eine fur ein Ha- 
mocyanin, eine Hamocyanin-Domane oder ein Fragment mit den immunologischen Ei- 
genschaften wenigstens einer Domane von Hamocyanin kodierende Nukleinsaurese- 
quenz. 



Weiterhin betrifft die Erfindung Konstrukte, die das Nukleinsauremolekul und gegebe- 
nenfalls einen zur Expressionskontrolle geeigneten Promoter enthalten. In einer bevor- 
zugten Ausfuhrungsform enthalt das Konstrukt ferner eine fur ein Antigen kodierende 
Nukleinsauresequenz. Die Erfindung betrifft auderdem Wirtszellen, die diese Nuklein- 
sauremolekufe und/oder Konstrukte enthalten. Die Erfindung betrifft ferner die rekombi- 
nante Expression der Nukleinsauremolekule und/oder Konstrukte in den Wirtszellen. 
Weiterhin betrifft die Erfindung Hamocyanin, eine Hamocyanin-Domane, ein Fragment 
mit den immunologischen Eigenschaften wenigstens einer Domane von Hamocyanin 
"und Hamocyanin-Fusionsproteine, die von den Nukleinsauremolekulen und/oder Kon- 
strukten kodiert werden. Die Erfindung betrifft weiterhin pharmazeutische Zusammen- 
setzungen, die die Nukleinsauremolekule und/oder Hamocyanin, eine Hamocyanin- 
.Domane, ein Fragment davon Oder ein Fusionsprotein, enthalten. Weiterhin betrifft die 
jfcrfindung Liposomen, die die Nuleinsauremolekuhle und/oder Hamocyanin, eine Ha- 
mocyanin-Domane, ein Fragment davon Oder ein Fusionsprotein, enthalten. Ferner be- 
trifft die Erfindung Antikorper, die durch Immunisieren eines Versuchstieres mit dem 
Hamocyanin. einer Hamocyanin-Domane, einem Fragment davon Oder einem Fusions- 
protein, erhaltlich sind, und deren Verwendung in Screening-Verfahren zum Identifizie- 
ren von Tumoren. 
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Fig. 3 



Figur 4 

cDNA-Seauenz in Verbindung mit Intronstruktur des HtH1 



Domane b 

AGATCATTTGACTCGTGAAGAGGAATACGAGCTAAGGATGGCTCTGGAGAGATTCCAGGCCGACA 
CATCCGTTGATGGGTACCAGGCTACAGTAGAGTACCATGGCCTTCCTGCTCGTTGTCCACGACCA 
GATGCAAAAGTCAGGTTCGCCTGTTGTATGCATGGCATGGCATCCTTCCCTCACTGGCACCGGCT 
GTTCGTTACCCAGGTGGAAGATGCTCTTGTACGGCGTGGATCGCCTATCGGTGTTCCTTATTGGG 
ACTGGACAAAACCTATGACTCACCTTCCAGACTTGGCATCAAATGAGACGTACGTAGACCCGTAT 
GGACATACACATCATAATCCATTCTTCAATGCAAATATATCTTTTGAGGAGGGACACCATCACAC 
GAGCAGGATGATAGATTCGAAACTGTTTGCCCCAGTAGCTTTTGGGGAGCATTCCCATCTGTTTG 
ATGGAATCCTGTACGCATTTGAGCAGGAAGATTTCTGCGACTTTGAGATTCAGTTTGAGTTAGTC 
CATAATTCTATTCATGCGTGGATAGGCGGTTCCGAAGATTACTCCATGGCCACCCTGCATTACAC 
AGCCTTTGACCCCATTTTCTACCTTCATCATTCCAATGTCGATCGTCTATGGGCAATCTGGCAAG 
CTCTTCAAATCAGGAGACACAAGCCATATCAAGCCCACTGTGCACAGTCTGTGGAACAGTTGCCA 
^TGAAGCCATTTGCTTTCCCATCACCTCTTAACAACAACGAGAAGACACATAGTCATTCAGTCCC 
fcACTGACATTTATGACTACGAGGAAGTGCTGCACTACAGCTACGATGATCTAACGTTTGGTGGGA 
TGAACCTTGAAGAAATTGAAGAAGCTATACATCTCAGACAACAGCATGAACGAGTCTTCGCGGGA 
TTTCTCCTTGCTGGAATAGGAACATCTGCACTTGTTGACATTTTCATAAATAAACCGGGGACCCA 
ACCACTCAAAGCTGGAGATATTGCCATTCTTGGTGGTGCCAAGGAAATGCCTTGGGCGTTTGACC 
GCTTGTATAAGGTCGAAATAACTGACTCATTAAAGACACTTTCCCTTGATGTCGATGGAGATTAT 
GAAGTCACTTTTAAAATTCATGATATGCACGGAAACGCTCTTGATACGGACCTGATTCCACACGC 
AGCAGTTGTTTCTGAGCCAGCTCACCCTACCTTTGAGGATGAAAAGCACAGCTTACGA 



Domane c 

atcagaaaaaatgtcgacagcttgactcctgaagaaacaaatgaactgcgtaaaggcg 

tcttgaaaatgatcatactgtaggtggattcaatcagcttggcgccttccatggagagcctaaat 

ggtgccctaatcctgaagcggagcacaaggttgcctgctgcgttcatggcatggccgttttccca 

cattggcacaggcttcttgctctccaggcggagaatgctcttagaaagcatgggtacagtggtgc 

tctaccatactgggattggactcgccccctttcccaacttcctgatctggttagtcatgagcagt 

^tacagatccttccgaccatcacgtgaagcataacccgtggttcaatggccacatcgatacagta 

fcatcaggataccaccagaagcgtacgggaggatctttatcaacaacctgaatttggacatttcac 

Bgatattgctcaacaagtcctcttagcattagaacaagatgacttctgttcgtttgaagtgcagt 

atgagatttcccataattttatccatgcacttgtaggaggaaccgacgcttatggcatggcatcg 

ctgagatatacagcatacgatccaatctttttcttgcatcattcaaacaccgacaggatctgggc 

tatttggcaatccctgcaaaaatacagaggcaaaccgtacaacactgccaactgcgccatagaat 

ctatgagaaggcccctgcaaccatttggactaagcagtgccattaaccctgacagaatcaccaga 

gagcatgctatcccgtttgatgtcttcaactatagagataaccttcattacgtatatgataccct 

ggaatttaatggtttgtcgatttcacaacttgatagagagctggaaaaaatcaagagtcacgaaa 

gagtatttgctggattcttgctgtcggggattaaaaaatctgctcttgtgaaattcgaagtttgt 

actccacctgataattgtcataaagcaggggagttttatctactcggggacgaaaacgagatggc 

ttgggcctatgaccgacttttcaagtatgatattactcaggttctggaagcaaaccatctacact 

tctatgatcatctcttcattcgctacgaagtctttgatcttaaaggagtgagtttgggaactgac 

ctgttccacactgcaaatgtggtacatgattccggcacag 



«• •••• ^•♦^ ^w*^ 

t > . *•*• * • 

^^^^ •••• »#« ^^^^3^^^ 

^^^^^^ » • « • • ^^^^^^^ 

Intron c/d 

GTACGTGGATTTGATTACATAGCAATGCTATATGATTTCAGTAATTACAACCTCAAGTCATGTAG 
CCGTTTTAGATTGCATTACATCAAACAGCATTGGATTAAATTGGGGGATTGTCCAGGCCGCATTA 
TGTTGCATTCCGAAAATAGTTTGTGTCCAGTGTCCACGTTTAAAATTAAACCATTTTAATCATAT 
TAGGGATAATTTTAATAGATGTTATAGTGCTTTATTTCATATTGTTACAGTGGACAGTCACCAAG 
GACATATTTTACTCTATAGATACACAAACACCAATTAAAACCCTGCTTTGGAAAGTCTAACTTTT 

TCCCCACAG 



Domane d 

GCACCCGTGATCGTGATAACTACGTTGAAGAAGTTACTGGGGCCAGTCATATCAGGAAGAATTTG 
AACGACCTCAATACCGGAGAAATGGAAAGCCTTAGAGCTGCTTTCCTGCATATTCAGGACGACGG 
AACATATGAATCTATTGCCCAGTACCATGGCAAACCAGGCAAATGTCAATTGAATGATCATAATA 
TTGCGTGTTGTGTCCATGGTATGCCTACCTTCCCCCAGTGGCACAGACTGTATGTGGTTCAGGTG 
GAGAATGCTCTCCTAAACAGGGGATCTGGTGTGGCTGTTCCTTACTGGGAGTGGACTGCTCCCAT 
AGACCATCTACCTCATTTCATTGATGATGCAACATACTTCAATTCCCGACAACAGCGGTACGACC 

•CTAACCCTTTCTTCAGGGGAAAGGTTACTTTTGAAAACGCAGTCACAACAAGGGACCCACAAGCC 
bGGCTCTTCAACTCAGATTATATGTATGAGAATGTTTTACTTGCACTGGAGCAGGAAAATTATTG 
TGACTTTGAAATTCA.GTTTGAGCTTGTTCATAACGCACTTCATTCCATGCTGGGAGGTAAAGGGC 
AGTACTCCATGTCCTCCCTGGACTATTCTGCGTTTGATCCCGTCTTCTTCCTACATCATGCCAAC 
ACGGACAGACTGTGGGCAATCTGGCAGGAACTACAAAGATTCCGAGAACTGCCTTATGAAGAAGC 
GAACTGTGCAATCAACCTCATGCATCAACCACTGAAGCCGTTCAGTGATCCACATGAGAATCACG 
ACAATGTCACTTTGAAATACTCAAAACCACAGGACGGATTCGACTACCAGAACCACTTCGGATAC 
AAGTATGACAACCTTGAGTTCCATCACTTATCCATCCCAAGTCTTGATGCTACCCTGAAGCAAAG 
GAGACATCACGACAGAGTGTTTGCGGGCTTCCTTCTTCATAACATAGGAACTTCTGCTGACATAA 
CTATCTACATATGTCTGCCTGACGGACGGCGTGGCAATGACTGCAGTCATGAGGCGGGAACATTC 
TATATCCTCGGAGGCGAAACAGAGATGCCTTTTATCTTTGACCGTTTGTATAAATTTGAAATCAC 
CAAACCACTGCAACAGTTAGGAGTCAAGCTGCATGGTGGAGTTTTCGAACTGGAGCTTGAGATCA 
AGGCATACAACGGTTCCTATCTGGATCCCCATACCTTTGATCCAACTATCATCTTTGAACCTGGA 

ACAG 



Intron d/e 

I^^MAATGCCATCTTAATACAGTTCGTTCGTTAAATTATATATGTTCGTTTACAACACCATACCTTG 
^^PE.TTGAGGTAAAACATCACTTGATATTGATAATGTAATGGTAATTGTTCTTGTTTGTAAAACCGT 

TTCTGGGGTGTTTATTCACTATCCACCTGGTGGATAGTGAGTAAACACATTCGGTTTAATATGGG 
TATCTAATGGACAGTGAAGTGTGCTGGCTAGGCAGATACCTTGGTTTCTGTGAATGGAGGTAGTA 
GAAAGGGGTTTTGATGATTGCAG 



Domane e 

ATACCCATATCTTGGACCACGACCATGAGGAAGAGATACTTGTCAGGAAGAATATAATTGATTTG 
AGCCCAAGGGAGAGGGTTTCTCTAGTCAAAGCTTTGCAAAGAATGAAGAATGATCGCTCCGCTGA 
TGGGTACCAAGCCATTGCCTCTTTCCATGCCCTGCCACCACTCTGTCCCAATCCATCTGCAGCTC 
ACCGTTATGCTTGCTGTGTCCATGGCATGGCTACATTTCCCCAGTGGCACAGACTGTACACTGTT 
CAGGTTCAGGATGCCCTGAGGAGACATGGTTCACTTGTTGGTATTCCTTACTGGGACTGGACAAA 
ACCAGTCAACGAGTTACCCGAGCTTCTTTCTTCAGCAACATTTTATCATCCAATCCGGAATATTA 
ATATTTCAAATCCATTCCTCGGGGCTGACATAGAATTTGAAGGACCGGGCGTTCATACAGAGAGG 
CACATAAATACTGAGCGCCTGTTTCACAGTGGGGATCATGACGGATACCACAACTGGTTCTTCGA 
AACTGTTCTCTTTGCTTTGGAACAGGAAGATTACTGCGATTTTGAAATACAATTTGAGATAGCCC 




• ••• «• • •••« 

• « « •«•• 

• •••• •#••«• 

• • •••«••«• 

•••• •« «• «• * ( ^ 




ATAATGGCATCCACAoBs uOTii TGG TGGAAG CG C AG TACAT GG MR lOTGAC AC CTTC ACT ATGCA 
TCATATGATCCAATTTTCTACATCCACCATTCACAGACGGACAGAATATGGGCTATTTGGCAAGA 
GCTGCAGAAGTACAGGGGTCTATCTGGGTCGGAAGCAAACTGTGCCATTGAACATATGAGAACAC 
CCTTGAAGCCTTTTAGCTTTGGGCCACCCTACAATTTGAATAGTCATACGCAAGAATATTCAAAG 
CCTGAGGACACGTTTGACTATAAGAAGTTTGGATACAGATATGATAGTCTGGAATTGGAGGGGCG 
ATCAATTTCTCGCATTGATGAACTTATCCAGCAGAGACAGGAGAAAGACAGAACTTTTGCAGGGT 
TCCTCCTTAAAGGTTTTGGTACATCCGCATCTGTGTCATTGCAAGTTTGCAGAGTTGATCACACC 
TGTAAAGATGCGGGCTATTTCACTATTCTGGGAGGATCAGCCGAAATGCCATGGGCGTTCGACAG 
GCTTTATAAGTATGACATTACTAAAACTCTTCACGACATGAACCTGAGGCACGAGGACACCTTCT 
CTATAGATGTAACTATCACGTCTTACAATGGAACAGTACTCTCGGGAGACCTCATCCAGACGCCC 
TCCATTATATTTGTACCTGGACGCC 



Intron e/f 

GTGAGTACCTGTTTGCACTAAGACTTCTGTAGGCTAAAAGTGTAAGAAATATCAATTAATTTCAA 
TTCACCCAAACTTGAAAACGGTACCTATATAGGTTAACTTTTTGTCTACAGTAAACTGAACATAC 
_ CTACACATTTCATGAAATGATCTCTCAATATTTTCCACCAACAG 

ATAAACTCAACTCACGGAAACATACACCTAACAGAGTCCGCCATGAGCTAAGTAGCCTTAGTTCC 
CGTGACATAGCAAGCTTGAAGGCAGCTTTGACAAGCCTTCAACATGATAATGGGACTGATGGTTA 
TCAAGCTATTGCTGCCTTCCATGGCGTTCCTGCGCAGTGCCACGAGCCATCTGGACGTGAG 



Intron f 

GTAAATTTACAGAGCTTTATGAAGTGTGTTCAGAGTGAAGAGACCAAGATATACTTATACCCAAA 

-Ae^AGeT-AGCAAeAGAeGA-TTTeAer-TGTTTCGGAeACTTTGT^^^ 

AAACGGAAACGTAACCGAGAATCAGTCCGTAAAGTGAGTGAGTGAGTTTGGGGCTTAACGTCGCA 
CTCAGCAATACCCCAGCTATGTGGCGACTCTCAGATTTACTGCTGGAGGAGAACCTACATAGCCC 
GGTTTAACCCGTGTGGTATGTAGTAAGACCAGCGCGGCATGGCTGGTATCTGACGGACGAAGGGT 
GGCGCTGCACGTATTCCAGTGGTACAACACTGCACCCCAATTTCACCGACCGGAGAACTGATCTC 
^^^CTTCGGAGATATCGCCTGCCTTCCACGGGATTCGAACTCGGTGACCTTCAAGCCAGCGCGCTT 
^^MTAGCGGGGGCGATTAGAGGTTNAAGGCCGACGGCTCTACCACCTTAACTATCCCCCGGCCCCAC 
^^rCCTGACGGAAATGTTTATAATTCAGCCTTTGTTTTCTTATTAAACACTCTTGGCAGATTTTCTA 
TAGATAATGGATTCACATGTAGACAGTCTCCCATTGTTGTAACTGGTAGTCAAGAGTTAGAATCT 
GAATACATTCTCCAAGATGGATCAAGGAAAACAATAATTACTTGATGTTGCAG 

ATCGCCTGTTGCATCCACGGCATGGCGACGTTTCCTCACTGGCACCGGTTGTACACTCTGCAGTT 
GGAGCAAGCGCTGCGCAGACACGGGTCCAGTGTTGCTGTTCCATACTGGGACTGGACCAAGCCAA 
TCACCGAACTGCCACACATTCTGACAGACGGAGAATATTATGACGTTTGGCAAAATGCCGTCTTG 
GCCAATCCGTTTGCAAGAGGTTATGTGAAAATTAAAGATGCATTTACGGTGAGAAATGTCCAGGA 
AAGTCTGTTCAAAATGTCAAGTTTTGGAAAGCACTCGCTTCTGTTTGACCAGGCTTTGTTGGCTC 
TTGAACAAACTGACTACTGTGACTTCGAAGTTCAGTTTGAAGTGATGCATAACACGATCCATTAT 
CTCGTAGGAGGGCGTCAAACGTACGCCTTCTCCTCTCTCGAGTATTCCTCATACGATCCAATCTT 
CTTTATTCACCACTCGTTTGTTGACAAAATATGGGCTGTATGGCAAGAACTGCAAAGCAGGAGAC 
ATCTACAGTTTAGAACAGCTGATTGTGCTGTGGGCCTCATGGGTCAGGCAATGAGGCCTTTCAAC 
AAGGATTTCAACCACAACTCGTTCACCAAGAAGCACGCAGTCCCTAATACAGTATTTGATTATGA 
AGATCTTGGCTATAACTATGACAACCTTGAAATCAGTGGTTTAAACTTAAATGAGATCGAGGCGT 
TAATAGCAAAACGCAAGTCACATGCTAGAGTCTTTGCTGGGTTCCTGTTGTTTGGATTAGGAACT 
TCGGCTGATATACATCTGGAAATTTGCAAGACATCGGAAAACTGCCATGATGCTGGTGTGATTTT 



: * : iftiA 

CATCCTTGGAGGTTCTGCAGAGATGCATTGGGCATACAACCGCCTCTACAAGTATGACATTACAG 
AAGCATTGCAGGAATTTGACATCAACCCTGAAGATGTTTTCCATGCTGATGAACCATTTTTCCTG 
AGGCTGTCGGTTGTTGCTGTGAATGGAACTGTCATTCCATCGTCTCATCTTCACCAGCCAACGAT 
AATCTATGAACCAGGCGAAG 



Intron f/g 

GTGAGATATATGCAAATTGAATGTTGTCCAGATGCGTTGTTTACATTTATATGCTTGGAATTGTC 
CTGAACGAATACAGTGGAATAACCAAAAGCTGAAAAATAAAAAGATATATACTTCATTCTGAATT 
TGTCAGTATTGCTGACCCAAAAACACGTTATCCATGTCGACACTATATTTGCCTTTCTGAATCTG 
AGACTGCGTTATGTTTCTAATAATCACGAAATATGGTATACAGGTTGTGTATCTGTAGAATACCC 
AAGGCAGAATTTAAAGGGTCACACCCTGTTTAATACAG 



Domane g 

ATCACCATGACGACCATCAGTCGGGAAGCATAGCAGGATCCGGGGTCCGCAAGGACGTGAACACC 
TGACTAAGGCTGAGACCGACAACCTGAGGGAGGCGCTGTGGGGTGTCATGGCAGACCACGGTCC 
AATGGCTTTCAAGCTATTGCTGCTTTCCATGGAAAACCAGCTTTGTGTCCCATGCCTGATGGCC 
ACAACTACTCATGTTGTACTCACGGCATGGCTACCTTCCCACACTGGCATCGCCTCTACACCAAG 
CAGATGGAGGATGCAATGAGGGCGCATGGGTCTCATGTCGGCCTGCCCTACTGGGACTGGACTGC 
TGCCTTCACCCACCTGCCAACACTGGTCACCGACACGGACAACAACCCCTTTCAACATGGACACA 
TTGATTATCTCAATGTCAGCACAACTCGATCTCCCCGAGACATGCTGTTCAACGACCCCGAGCAT 
GGATCAGAGTCGTTCTTCTACAGACAAGTCCTCTTAGCTCTGGAACAAACTGATTTCTGCAAATT 
CGAAGTTCAGTTTGAGATAACCCACAATGCCATCCATTCCTGGACAGGTGGCGACAGCCCCTACG 
GAATGTCCACTCTCGACTTCACTGCCTACGATCCTCTCTTCTGGCTTCACCACTCCAACACCGAC 
AGAATCTGGGCTGTCTGGCAAGCTTTGCAAGAATACAGAGGACTTCCATACAACCATGCCAATTG 
TGAGATCCAGGCAATGAAAACGCCCCTGAGGCCTTTCAGTGACGATATCAACCACAACCCAGTCA 
--eAAAGGCTAAeGeGAAGCCATTAGATGTGTTCGAGTATAATCGGTTGAGCTTCCAGTACGACAAC-" 
CTCATCTTCCATGGATACAGTATTCCGGAACTTGATCGCGTGCTTGAAGAAAGAAAGGAGGAGGA 
CAGAATATTTGCTGCCTTCCTTCTCAGTGGAATCAAGCGTAGTGCTGATGTAGTGTTCGACATAT 
GCCAGCCAGGACACGAATGTGTGTTCGCAGGGACTTTTGCGATTTTGGGAGGGGAGCTAGAAATG 
CCCTGGTCCTTTGACAGACTGTTCCGCTATGACATCACCAAGGTGATGAAGCAGCTACACCTGAG 
GCATGACTCGGACTTTACGTTCAGGGTGAAGATTGTCGGCACTGACGACCACGAGCTTCCTTCCG 
^CAGTGTCAAAGCACCAACTATTGAATTTGAACCTGGCG 



Intron g/h 



Domane h 

TGCACAGAGGCGGGAAGCACGAAGATGAACACCATGATGACAGACTCGCAGATGTCCTGATAAGG 
AAAGAAGTTGACTTCCTCTCCCTGCAAGAGGCCAACGCAATTAAGGATGCACTGTACAAGCTCCA 
GAATGACGACAGTAAAGGCGGCTTTGAGGCCATAGCTGGCTATCACGGGTATCCTAATATGTGTC 
CAGAAAGAGGTACCGACAAGTATCCCTGCTGCGTCCACGGAATGCCCGTGTTCCCCCACTGGCAT 
CGCCTGCACACCATTCAGATGGAGAGAGCTCTGAAAAACCATGGCTCTCCAATGGGTATTCCTTA 
CTGGGATTGGACAAAGAAGATGTCGAGTCTTCCATCTTTCTTTGGAGATTCCAGCAACAACAACC 
CCTTCTACAAATATTACATCCGGGGCGTGCAGCACGAAACAACCAGGGACGTTAATCAGAGACTC 
TTTAATCAAACCAAGTTTGGTGAATTTGATTACCTATATTACCTAACTCTGCAAGTCCTGGAGGA 
AAACTCATACTGTGACTTTGAAGTTCAGTATGAGATCCTCCATAACGCCGTCCACTCCTGGCTTG 
GAGGAACTGGACAGTATTCCATGTCTACCCTGGAGTATTCAGCCTTCGACCCTGTCTTCATGATT 
CACCACTCGAGTTTGGATAGAATCTGGATCCTTTGGCAGAAGTTGCAAAAGATAAGAATGAAGCC 



TT APT A pnr* n TT'riria ^^^m^^B rr^rir'ri 7\ TV r!7\ /^T^T^7\ rp/^ TV TV 7\ o7\ / , 

AAACCGTTAATGAAGATGAATTCACCCGCATCAACTCTTTCCCAAGCATACTGTTTGACCACTAC 
AGGTTCAACTATGAATACGATAACATGAGAATCAGGGGTCAGGACATACATGAACTTGAAGAGGT 
AATTCAGGAATTAAGAAACAAAGATCGCATATTTGCTGGTTTTGTTTTGTCGGGCTTACGGATAT 
CAGCTACAGTGAAAGTATTCATTCATTCGAAAAACGATACAAGTCACGAAGAATATGCAGGAGAA 
TTTGCAGTTTTGGGAGGTGAGAAGGAGATGCCGTGGGCATATGAAAGAATGCTGAAATTGGACAT 
CTCCGATGCTGTACACAAGCTTCACGTGAAAGATGAAGACATCCGTTTTAGAGTGGTTGTTACTG 
CCTACAACGGTGACGTTGTTACCACCAGGCTGTCTCAGCCATTCATCGTCCACCGTCCAGCCCAT 
GTGGCTCACGACATCTTGGTAATCCCAGTAGGTGCGGGCCATGACCTTCCGCCTAAAGTCGTAGT 
AAAGAGCGGCACCAAAGTCGAGTTTACACCAATAGATTCGTCGGTGAACAAAGCAATGGTGGAGC 
TGGGCAGCTATACTGCTATGGCTAAATGCATCGTTCCCCCTTTCTCTTACCACGGCTTTGAACTG 
GACAAAGTCTACAGCGTCGATCACGGAGACTACTACATTGCTGCAGGTACCCACGCGTTGTGTGA 
GCAGAACCTCAGGCTCCACATCCACGTGGAACACGAGTAG 



3'UTR 



_ TTCACAG 

^^^ntron 3'UTR 



GTGAGGAGAAGGCCCCAGGCTAGCAGGGCAATGGATGAAGGAAATAGGGGCAAAGGGAATAGCAG 
TTACACCATCGACATTTCCAACCTCCTCAGAAACTAATATATAGCCTTAATACAACCAGCCAAGA 
CTCAACGGGCAGCCGGGGTGGGGGGATTTGGTGGTCGCTGTTTCAGACCAGGGTGCAAAATATCA 
GTGCGCAAATCAACATGTTGCGTGTCAGACACTGACACAGCAGTCATTGAACCTGCAGACCCATA 
ACAGGAAAATGGGGCAGATACGATCAAAGACAGTGTAAAATAGGGATAAGTAGGCATATGCAACC 
ACCTGATGGAAATGAAAAGGGGTAAGTTTAAACCCCGGCTACCAAAGGTCCAATGGTTCCTTAAC 
CCAGCTTACGCTATCCCTCTAATTTCAGTATTGAGCTGATTTCTGTCGAGTTCATGTAAACTGTA 
TACTTTCTGTATTATTACAG 



3'UTR 



GTTGCTATGCCGACTGCGCTATATTGGTGAACGAGACGATGAGGACATCTCTGAAAGAGTTCGCC 
GTGATGTGTAGGTCACGGAAGTATTGTTGAGCTAACAATATGATGATTTCAAAATGACTTGGC 
TCTAGGACAAAGACATAATTCATCAGCACCCTGTGCACCAACTCTTTGTTTGCTGCAAACGTC 
'GACAAGCGACACGTCAATCAACAAGCTGTTCAAACTCAAGTGGATGTAACTAGAATCGTTGGGC 
CATCGTTCACAAAGTATTGACAGATGTCACACATGATGGCGAGAAACACTTTAGAACTTTTAATG 
ACCTAGAGTGACTTGTAAATATGTAAATATATTCTTCAAAGACTCAGCTGAACTATTGTTGGATA 
ACACATCAATTCCCTCAACAAAATGCTTTATCTTCACATGGATGTATGTAATGTGGCCGGCAATA 
AAGTATATATATGTATAAAAAAAAAAAAAAAAAA 



«««« **f^^Bj^^^l 

Figur 5 

Abqeleitete Primarstruktur des HtH1 



DHLTREEEYELRMALERFQADTSVDGYQATVEYHGLPARCPRPDAKVRFACCMHGMASFPHWHRL 
FVTQVEDALVRRGSPIGVPYWDWTKPMTHLPDLASNETYVDPYGHTHHNPFFNANISFEEGHHHT 
SRMIDSKLFAPVAFGEHSHLFDGILYAFEQEDFCDFEIQFELVHNSIHAWIGGSEDYSMATLHYT 
AFDPIFYLHHSNVDRLWAIWQALQIRRHKPYQAHCAQSVEQLPMKPFAFPSPLNNNEKTHSHSVP 
TDIYDYEEVLHYSYDDLTFGGMNLEEIEEAIHLRQQHERVFAGFLLAGIGTSALVDIFINKPGTQ 
PLKAGDIAILGGAKEMPWAFDRLYKVEITDSLKTLSLDVDGDYEVTFKIHDMHGNALDTDLIPHA 
A WS E P AHPT FEDE KHS L 

RIRKNVDSLTPEETNELRKALELLENDHTVGGFNQLGAFHGEPKWCPNPEAEHiCVACCV^ 
PHWHRLLALQAENALRKHGYSGALPYWDWTRPLSQLPDLVSHEQYTDPSDHHVKHNPWFNGHIDT 
WQDTTRSVREDLYQQPEFGHFTDIAQQVLLALEQDDFCSFEVQYEISHNFIHALVGGTDAYGMA 
SLRYTAYDPIFFLHHSNTDRIWAIWQSLQKYRGKPYNTANCAIESMRRPLQPFGLSSAINPDRIT 
REHAIPFDVFNYRDNLHYVYDTLEFNGLS I SQLDRELEKIKSHERVFAGFLLSGIKKSALVKFEV 

•TPPDNCHKAGEFYLLGDENEMAWAYDRLFKYDITQVLEANTHLHFYDHLFIRYEVFDLKGVSLGT 
LFHTANWHDSGT 

GTRDRDNYVEEVTGASHIRKmiNDLNTGEMESLRAAFLHIQDDGTYESIAQYHGKPGKCQLISro 

lACCVHGMPTFPQWHRLYWQVENALLNRGSGVAVPYWEWTAPIDHLPHFIDDATYFNSRQQRYD 

PNPFFRGKVTFENAVTTRDPQAGLFNSDYMYENVLIJULEQENYCDFEIQFELVH^ 

QYSMSSLDYSAFDPVFFLHHANTDRLWAIWQELQRFRELPYEEANCAINLMHQPLKPFSDPHENH 

DNVTLKYSKPQDGFDYQNHFGYKYDNLEFHHLSIPSLDATLKQRRHHDRVFAGFLLHNIGTSADI 

TIYICLPDGRRGNDCSHEAGTFYILGGETEMPFIFDRLYKFEITKPLQQLGVKLHGGVFELELEI 

KAYNGSYLDPHTFDPTIIFEPGT 

DTHILDHDHEEEI'LVRKNIIDLSPRER-VSLV^KALQRJ^-K^ 

HRYACCVHGMATFPQWHRLYTVQVQDALRRHGSLVGIPYWDWTKPVNELPELLSSATFYHPIRNI 
NISNPFLGADIEFEGPGVHTERHINTERLFHSGDHDGYHNWFFETVLFALEQEDYCDFEIQFEIA 
HNGIHTWIGGSAVHGMGHLHYASYDPIFYIHHSQTDRIWAIWQELQKYRGLSGSEANCAIEHMRT 
PLKPFSFGPPYNLNSHTQEYSKPEDTFDYKKFGYRYDSLELEGRSISRIDELIQQRQEKDRTFAG 
FLLKGFGTSASVSLQVCRVDHTCKDAGYFTILGGSAEMPWAFDRLYKYDITKTLHDMNLRHEDTF 

#IDVTITSYNGTVLSGDLIQTPSIIFVPGR 
ECLNSRKHTPNRVRHELSSLSSRDIASLKAALTSLQHDNGTDGYQAIAAFHGVPAQCHEPSGREI 
ACCIHGMATFPHWHRLYTLQLEQALRRHGSSVAVPYWDWTKPITELPHILTDGEYYDVWQNAVLA 
NPFARGYVKIKDAFTVRJWQESLFKMSSFGKHSLLFDQALLALEQTDYCDFEVQ 
VGGRQTYAFSSLEYSSYDPIFFIHHSFVDKIWAWQELQSRRHLQFRTADCAVGLMGQAMRPFNK 
DFNHNS FTKKHAVPNTVFDYEDLGYNYDNLE I SGLNLNEI EALI AKRKSHARVFAGFLLFGLGTS 
ADIHLEICKTSENCHDAGVIFILGGSAEMHWAYNRLYKYDITEALQEFDINPEDVFHADEPFFLR 
LSWAVNGTVIPSSHLHQPTIIYEPGE 

DHHDDHQSGSIAGSGWKDVNTLTKAETDNLREALWGVMADHGPMGFQAIAAFHGKP 

HNYSCCTHGI^TFPHWHRLYTKQMEDAMRAHGSHVGLPYWDWTAAFTHLPTLVTDTDI^n^ 

IDYLNVSTTRSPRDMLFNDPEHGSESFFYRQVLLALEQTDFCKFEVQFEITHNAIHSWTGGHSPY 

GMSTLDFTAYDPLFWLHHSNTDRIWAVWQALQEYRGLPYNHANCEIQANKTPLRPFSDDINHNPV 

TKANAKPLDVFE YNRL S FQ YDNL I FHGYS I PELDRVLEERKEEDRI FAAFLLSG I KRS ADWFD I 

CQPGHECVFAGTFAILGGELEMPWSFDRLFRYDITKVMKQLHLRHDSDFTFRVKIVGTDDHELPS 

DSVKAPTIEFEPG 



\'TIRGGKKEDEHHDDP^^^^l^K^:VDFLSLOEANAIKDALYK^^ 

PERGTDKYPCCVHGMPVFPHWHRLHTIQMERAiKNHGSPMGIPYWDWTKKM 

PFY KYY I RGVQHETTRD VNQRLFNQTKFGE FD YL YYLTLQVLEENS YCDFE VQ YE I LHNAVHS WL 

GGTGQYSMSTLEYSAFDPVFMIHHSSLDRIWILWQKLQKIRMKPYYALDCAGDRLMKDPLHPFNY 

ETVNEDEFTRINSFPSILFDHYRFNYEYDNMRIRGQDIHELEEVIQELRNKDRIFAGFVLSGLRI 

SATVKVFIHSKNDTSHEEYAGEFAVLGGEKEMPWAYERMLKiDISDAVHKLHVKDEDIR^ 

AYNGDWTTRLSQPFIVHRPAHVAHDILVIPVGAGHDLPPKVWKSGTKVEFTPIDSSVNKA^ 

LGSYTAMAKCIVPPFSYHGFELDKVYSVDHGDYYIAAGTHALCEQNLRLHIHVEHE 



Figur 6 

cDNA-Sequenz in Verbindunq mit Intronstruktur des HtH2 



Domane b 

GTTTCTTTCTGTCACATATTGGTACATCAGCGAATGTTGAAATCATTATAGACCATGGGACTCTT 
CATACCTCCGTGGGCACGTTTGCTGTTCTTGGCGGAGAGAAGGAGATGAAATGGGGATTTGACCG 
TTTGTACAAATATGAGATTACAGATGAACTGAGGCAACTTAATCTCCGTGCTGATGATGTTTTCA 
GCATCTCTGTTAAAGTAACTGATGTTGATGGCAGTGAGCTGTCCTCTGAACTCATCCCATCTGCT 
GCTATCATCTTCGAACGAAGCCATATTGACCATCAGGACCCGCATCATGACACAATC 



Intron b/c 



Domane c 

•ATTAGGAAAAATGTTGATAATCTTACACCCGAGGAAATTAATTCTCTGAGGCGGGCAATGGCAGA 
bcTTCAATCAGACAAAACCGCCGGTGGATTCCAGCAAATTGCTGCTTTTCACGGGGAACCCAAAT 
GGTGCCCAAGTCCCGATGCTGAGAAGAAGTTCTCCTGCTGTGTCCATGGAATGGCTGTCTTCCCT 
CACTGGCACAGACTCCTGACCGTGCAAGGCGAGAATGCCCTGAGAAAGCATGGATGTCTCGGAGC 
TCTCCCCTACTGGGACTGGACTCGGCCCCTGTCTCACCTACCTGATTTGGTTTTGGTAAGTAGCA 
GAACTACACCGATGCCATATTCCACCGTGGAAGCCCGAAACCCCTGGTACAGCGGCCATATTGAT 
ACAGTTGGTGTTGACACAACAAGAAGCGTCCGTCAAGAACTGTATGAAGCTCCTGGATTTGGCCA 
TTATACTGGGGTCGCTAAGCAAGTGCTTCTGGCTTTGGAGCAGGATGACTTCTGTGATTTTGAAG 
TCCAGTTTGAGATAGCTCACAATTTCATTCACGCTCTTGTCGGCGGAAGCGAGCCATATGGTATG 
GCGTCACTCCGTTACACTACTTATGATCCAATTTTCTACCTCCATCATTCTAACACTGACAGACT 
CTGGGCTATATGGCAGGCTCTACAAAAGTACAGGGGCAAACCTTACAATTCCGCCAACTGCGCCA 
TTGCTTCTATGAGAAAACCCCTACAACCCTTTGGTGTGAGTGATGAGATGAACCGGGATGATGAG 
ACAAGACAGCATGCTGTTCCTTTCAGTGTCTTTGATTACAAGAACAACTTCAATTATGAATATGA 
CACCCTTGACTTCAACGGACTATCAATCTCCCAGCTGGACCGTGAACTGTCACGGAGAAAGTCTC 
ATGACAGAGTATTTGCCGGATTTTTGCTGCATGGTATTCAGCAGTCTGCACTAGTTAAATTCTTT 
GTCTGCAAATCAGATGATGACTGTGACCACTATGCTGGTGAATTCTACATCCTTGGTGATGAAGC 
TGAAATGCCATGGGGCTATGATCGTCTTTACAAATATGAGATCACTGAGCAGCTCAATGCCCTGG 
^^^TCTACACATCGGAGATAGATTCTTCATCAGATACGAAGCGTTTGATCTTCATGGTACAAGTCTT 
^^^GAAGCAACATCTTCCCCAAACCTTCTGTCATACATGACGAAGGGGCAG 



Intron c/d 

GTGAGAACATTGATAATAGTTCAAATGAAGTATATCCGATTCAAGCTGTCGATACAAGATGAGAT 
ACATAATCACAATGTTTGTATTAGATATCTCTCTTAATTTAATGCCGCTTTTATCAATATTCGAG 
CAATCCTTCAGCAACATACACCAGCAAATGTTTCATCAACAGACTATATTATTTAATCTTTTAAA 
AATCCTTTTCTGTTGTTATAAATACTTAAAGTATCGAATTCCTTGAATGCGTCTTCTCTGCAGCA 
TATAGTTAAGTTGTTGTGTTTCTCTGTCAG 



Donnane d 

GTCACCATCAGGCTGACGAGTACGACGAAGTTGTAACTGCTGCAAGCCACATCAGAAAGAATTTA 
AAAGATCTGTCAAAGGGAGAAGTAGAGAGCCTAAGGTCTGCCTTCCTGCAACTTCAGAACGACGG 
AGTCTATGAGAATATTGCCAAGTTCCACGGCAAGCCTGGGTTGTGTGATGATAACGGTCGCAAGG 
TTGCCTGTTGTGTCCATGGAATGCCCACCTTCCCCCAGTGGCACAGGCTCTATGTCCTCCAGGTG 




GAGAATG CTTTG GTCj^^^R?9SP!GG AT CTGCCGTCT CT GTG G G A.'J^^BF 35KAGTGGA.GT GAAA.C AT T 
TACAGAGCTGCCATCTTTGATTGGTGAGGCTACCTATTTCAATTCCCGTCAACAAACGTTTGACC 
CTAATCCTTTCTTCAGAGGTAAAATCAGTTTTGAGAATGCTGTTACAACACGTGATCCCCAGCCT 
GAGCTGTACGTTAACAGGTACTACTACCAAAACGTCATGTTGGTTTTTGAACAGGACAACTACTG 
CGACTTCGAGATACAGTTTGAGATGGTTCACAATGTTCTCCATGCTTGGCTTGGTGGAAGAGCTA 
CTTATTCTATTTCTTCTCTTGATTATTCTGCATTCGACCCTGTGTTTTTCCTTCACCATGCGAAC 
ACAGATAGATTGTGGGCCATCTGGCAGGAGCTGCAGAGGTACAGGAAGAAGCCATACAATGAAGC 
GGATTGTGCCATTAACCTAATGCGCAAACCTCTACATCCCTTCGACAACAGTGATCTCAATCATG 
ATCCTGTAACCTTTAAATACTCAAAACCCACTGATGGCTTTGACTACCAGAACAACTTTGGATAC 
AJVGTATGACAACCTTGAGTTCAATCATTTCAGTATTCCCAGGCTTGAAGAAATCATTCGTATTAG 
ACAACGTCAAGATCGTGTGTTTGCAGGATTCCTCCTTCACAACATTGGGACATCCGCAACTGTTG 
AGATATTCGTCTGTGTCCGTACCACCAGCGGTGAGCAAAACTGTGAAAACAAAGCCGGAACATTT 
GCCGTACTCGGAGGAGAAACAGAGATGGCGTTTCATTTTGACAGACTCTACAGGTTTGACATCAG 
TGAAACACTGAGGGACCTCGGCATACAGCTGGACAGCCATGACTTTGACCTCAGCATCAAGATTC 
AAGGAGTAAATGGATCCTACCTTGATCCACACATCCTGCCAGAGCCATCCTTGATTTTTGTGCCT 
GGTTCAAGT 



Intron d/e 

AAGAAAGTTTCACTGTCTAAATCTTTTTTTATGATAGAGGGTAGAGAAGTGGAGACAATGTGACA 
ATATATTGAATAAAGTTGTTTAAAATTTATAACTCTCATAAGTTCATATTATGCTGAAGCTGTAG 
CCATCTATAACTGTGTAACATGAAATGTTAAGAGATTAACCTAAATACTTCAGCTGATAACAAAA 
CAATGTTAATACATACGTCAATGTAACATTTTCTTATCTTTAGGTTATAGCATAAACACTTCAGA 
GATACAGTGACGAAAACCTCTATTTAAATATTTCAGGT 



Domane e 

TCTTTCCTGCGTCCTGATGGGCATTCAGATGACATCCTTGTGAGAAAAGAAGTGAACAGCCTGAC 
AACCAGGGAGACTGCATCTCTGATCCATGCTCTGAAAAGTATGCAGGAAGACCATTCACCTGACG 
GGTTCCAAGCCATTGCCTCTTTCCATGCTCTGCCACCAGTCTGCCCTTCACCATCTGCAGGTCAC 
CGTTATGCTTGCTGTGTCCACGGCATGGCTACATTTCCCCAGTGGCACAGATTGTACACTGTACA 
GTTCCAGGATGCACTGAGGAGACATGGAGCTACGGTAGGTGTACCGTATTGGGATTGGCTGCGAC 
CGCAGTCTCACCTACCAGAGCTTGTCACCATGGAGACATACCATGATATTTGGAGTAACAGAGAT 
^TCCCCAATCCTTTCTACCAAGCCAATATTGAGTTTGAAGGAGAAAACATTACAACAGAGAGAGA 
^GTCATTGCAGACAAACTTTTTGTCAAAGGTGGACACGTTTTTGATAAACTGGTTCTTCAAACAA 
HcCATCCTAGCGCTGAGCAGGAAAACTACTGTGACTTTGAGATTCAGTTTGAAATTCTTCACAAC 
GGCGTTCACACGTGGGTCGGAGGCAGTCGTACCTACTCTATCGGACATCTTCATTACGCATTCTA 
CGACCCTCTTTTCTACCTTCACCATTTCCAGACAGACCGTATTTGGGCAATCTGGCAAGAACTCC 
AGGAACAGAGAGGGCTCTCGGGTGATGAGGCTCACTGTGCTCTCGAGCAAATGAGAGAACCATTG 
AAGCCTTTCAGCTTCGGCGCTCCTTATAACTGGAATCAGCTCACACAGGATTTGTCCCGACCCGA 
GGACACCTTCGACTACAGGAAGTTTGGTTATGAATATGACAATTTAGAATTCCTGGGAATGTCAG 
TTGCTGAACTGGA.TCAATACATTATTGAACATCAAGAAAATGATAGAGTATTCGCTGGGTTCCTG 
TTGAGTGGATTCGGAGGTTCCGCATCAGTTAATTTCCAGGTTTGTAGAGCTGATTCCACATGTCA 
GGATGCTGGGTACTTCACCGTTGTTGGTGGCAGTGCTGAGATGGCGTGGGCATTTGACAGGCTTT 
ACAAATATGACATTACTGAAACTCTGGAGAAAATGCACCTTCGATATGATGATGACTTCACAATC 
TCTGTCAGTCTGACCGCCAACAACGGAACTGTCCTGAGCAGCAGTCTAATCCCAACACCGAGTGT 
CATATTCCAGCGGGGACATGGTGACATAAATACCAGGAGCATGTCACCG 



Intron e/f 



• * ••«• 

4 *> , • •••• .^fc* 

^^^^.^^^^ •••• •••• ^^^^B 

Domane f 

AACCGTGTTCGCCGTGAGCTGAGCGATCTGTCTGCGAGGGACCTGTCTAGTCTCAAGTCTGCTCT 
GCGAGACCTACAGGAGGATGATGGCCCCAACGGATACCAGGCTCTTGCAGCCTTCCATGGGCTAC 
CAGCAGGCTGCCATGATAGCCGGGGAAATGAGATCGCATGTTGCATTCACGGGATGCCGACCTTC 
CCCCAGTGGCACAGACTGTACACCCTGCAGTTGGAGATGGCTCTGAGGAGACATGGATCATCTGT 
CGCCATCCCCTACTGGGACTGGACAAAGCCTATCTCCGAACTCCCCTCGCTCTTCACCAGCCCTG 
AGTATTATGACCCATGGCATGATGCTGTGGTAAACAACCCATTCTCCAAAGGTTTTGTCAAATTT 
GCAAATACCTACACAGTAAGAGACCCACAGGAGATGCTGTTCCAGCTTTGTGAACATGGAGAGTC 
AATCCTCTATGAGCAAACTCTTCTTGCTCTTGAGCAAACCGACTACTGTGATTTTGAGGTACAGT 
TTGAGGTCCTCCATAACGTGATCCACTACCTTGTTGGTGGACGTCAGACCTACGCATTGTCTTCT 
CTGCATTATGCCTCCTACGACCCATTCTTCTTTATACACCATTCCTTTGTGGATAAGATGTGGGT 
AGTATGGCAAGCTCTTCAAAAGAGGAGGAAACTTCCATACAAGCGAGCTGACTGTGCTGTCAACC 
TAATGACTAAACCAATGAGGCCATTTGACTCCGATATGAATCAGAACCCATTCACAAAGATGCAC 
-GCAGTTCCCAACACACTCTATGACTACGAGACACTGTACTACAGCTACGATAATCTCGAAATAGG 
TGGCAGGAATCTCGACCAGCTTCAGGCTGAAATTGACAGAAGCAGAAGCCACGATCGCGTTTTTG 
CTGGATTCTTGCTTCGTGGAATCGGAACTTCTGCTGATGTCAGGTTTTGGATTTGTAGAAATGAA 
AATGACTGCCACAGGGGTGGAATAATTTTCATCTTAGGTGGAGCCAAGGAAATGCCATGGTCATT 

•TGACAGAAACTTCAAGTTTGATATCACCCATGTACTCGAGAATGCTGGCATTAGCCCAGAGGACG 
IbGTTTGATGCTGAGGAGCCATTTTATATCAAGGTTGAGATCCATGCTGTTAACAAGACCATGATA 
CCGTCGTCTGTGATCCCAGCCCCAACTATCATCTATTCTCCTGGGGAAGGT 



Intron f/g 

GAGAGAACCAGTAATAGCTACTGTCTACAAAGAATGTGTTCATTTAAAGACCTGACTGTAGGCCG 
ATGGCTGCTGTCATCTCCTCCGCCTCCTCCTCCTGTTCCTCCTCCGAAGGGGTCAGCTTCAGGTT 
CTCTTGCCAATATGCCAAGCAGACCTCCTGAGCAGGCAGTATATATACGTAAGGGAAGCAAGTAT 
GGACCATCGCGCGGCATGTAGAGATACAATGATCAGCTGTCTGCTGTTCCACTCCTGTCAGACAA 
— T-GAGATAAACATGAATACAGTATTACTCATCATCGTTCCAATTTTCAACCCTAGTATTTATTAAA 
AAATAGGATATTTTTATNATNTTNTNTCCCTNTTNTATNATTTTTNNATAGTATATTNNTACTTA 
NTCTCATCNNTAATATTCTTGNTATNACANNNTANNATCTNTNTTCTTN^ 
TNNNTCTTNNTANTTACTNTNNTTCTANATTANNA 



^omane g 

^CGCTGCTGACAGTGCACACTCGGCCAACATTGCTGGCTCTGGGGTGAGGAAGGACGTCACGAC 
CCTTACTGTGTCTGAGACCGAGAACCTAAGACAGGCTCTTCAAGGTGTCATCGATGATACCGGTC 
CCAATGGTTACCAAGCAATAGCATCCTTCCACGGAAGTCCTCCAATGTGCGAGATGAACGGCCGC 
AAGGGTGCCTGTTGTGCTCACGGTATGGCCTCCTTCCCACACTGGCACAGACTGTATGTGAAGCA 
GATGGAAGATGCCCTGGCTGACCACGGGTCACATATCGGCATCCCTTACTGGGACTGGACAACTG 
CCTTCACAGAGTTACCCGCCCTTGTCACAGACTCCGAGAACAATCCCTTCCATGAGGGTCGCATT 
GATCATCTCGGTGTAACCACGTCACGTTCCCCCAGAGACATGCTGTTTAACGACCCAGAGCAAGG 
ATCAGAGTCGTTCTTCTATAGACAAGTCCTCCTGGCTTTGGAGCAGACTGACTACTGCCAGTTCG 
AAGTCCAGTTTGAGCTGACCCACAACGCCATTCACTCCTGGACAGGTGGACGTAGCCCTTACGGA 
ATGTCGACCCTCGAGTTCACAGCCTACGATCCTCTCTTCTGGCTTCACCACTCCAACACCGACAG 
AATCTGGGCTGTCTGGCAAGCACTGCAGAAATACCGAGGACTCCCATACAACGAAGCACACTGTG 
AAATCCAGGTTCTGAAACAGCCCTTGAGGCCATTCAACGATGACATCAACCACAATCCAATCACC 
AAGACTAATGCCAGGCCTATCGATTCATTTGATTATGAGAGGTTTAACTATCAGTATGACACCCT 
TAGCTTCCATGGTAAGAGCATCCCTGAACTGAATGACCTGCTCGAGGAAAGAAAAAGAGAAGAGA 
GAACATTTGCTGCCTTCCTTCTTCGTGGAATCGGTTGCAGTGCTGATGTCGTCTTTGACATCTGC 
CGGCCCAATGGTGACTGTGTCTTTGCAGGAACCTTTGCTGTGCTGGGAGGGGAGCTAGAAATGCC 
TTGGTCCTTCGACAGACTGTTCCGCTATGACATCACCAGAGTCATGAATCAGCTCCATCTCCAGT 



ATGATTCAG ATTT CAi^^^lfcGGTGAAGCTTGTTGC CAC CAjllJi^ll^ 

CTTCTCAAGTCACCAACAATTGAACATGAACTTGG 



Intron g/h 



GTATGTTATCTTATCATCAAATGTGTGATCAGATACTGGAGACGTTTTCATATTAACTTGGTCAG 
CATTAGTTGATGATTTTGGTGCGATGTTGACGACAAGGAGTCAAGCATTAACACATTCAACACAT 
CTTTAATCTGATATGAGAAGGGAATAAATTGATCCAGTATTGATGATTGAAGTTAGATTAACAGT 
GAAAGATATACCAGTTTTGATAATCGTATAAAACAGTAGCAGAATTGTATCGTGAAAACTAAATG 
TGGGAAGGCGAACGCCAAGCAGATTTTAGATTACGATCGTGTGCTAGAATAATTCACAATAACCC 
AGACGTCGGAAATGTGGTTGTCTATGGCAATGGTTACGATTAATTGCTAACATGCACGATTTACC 
TATTTCAG 



Domane h 



.^^;a 



agcccacagaggaccagttgaagaaacagaagtcactcgccaacatactgacggcaatgcacact 
J'tcatcgtaaggaagttgattcgctgtccctggatgaagcaaacaacttgaagaatgccctttac 
gctacagaacgaccacagtctaacgggatacgaagcaatctctggttaccatggataccccaa 
tctgtgtccggaagaaggcgatgacaaaatacccctgctgcgtccccggatgggcatctttcctt 
actggcacagactcttgaccattcaactggaaagagctcttgagcacaatggtgcactgcttggt 
gttccttactgggactggaacaaggacctgtcgtcactgccggcgttcttctccgactccagcaa 
caacaatccctacttcaagtaccacatcgccggtgttggtcacgacaccgtcagagagccaacta 
gtcttatatataaccagccccaaatccatggttatgattatctctattacctagcattgaccacg 
cttgaagaaaacaattactgggactttgaggttcagtatgagatcctccacaacgccgtccactc 
ctggcttggaggatcccagaagtattccatgtctaccctggagtattcggcctttgaccctgtct 
ttatgatccttcactcgggtctagacagactttggatcatctggcaagaacttcagaagatcagg 
agaaagccctacaacttcgctaaatgtgcttatcatatgatggaagagccactggcgcccttcag 
ctatccatctatcaaccaggacgagttcacccgtgccaactccaagccttctacagtttttgaca 
gccataagttcggctaccattacgataacctgaatgttagaggtcacagcatccaagaactcaac 
acaatcatcaatgacttgagaaacacagacagaatctacgcaggatttgttttgtcaggcatcgg 
tacgtctgctagtgtcaagatctatctccgaacagatgacaatgacgtuvgaagttggaactttca 
ctgtcctgggaggagagagggaaatgccatgggcctacgagcgagttttcaagtatgacatcaca 
gaggttgcagatagacttaaaattaagttatggggacaccctttaacttccggaactggagatca 
fzatccttacgaatggaatcggtggtaaacaagagcctacccaaatcctttcatcatctacagacc 
ccaatcatgactacgatgttcttgttatcccagtanggaagaaaccttcacatccctcccaaa 
tgtcgtcaagaaaggcacccgcatcgagttccacccagtcgatgattcagttacgagaccagt 
tgttgatcttggaagctacactgcactcttcaactgtgtggtaccaccgttcacataccacggat 

TCGAACTGAACCACGTCTATTCTGTCAAGCCTGGTGACTACTATGTTACTGGACCCACGAGAGAC 

ctttgccagaatgcagatgtcaggattcatatccatgttgaggatgagtaa 



3'-UTR 



cgcaacaggt 



Intron 3'-UTR 



gagataagaaacccttctaacagtaatacgacaccacattacagcttaaacatgattgccatcga 
tgttttcatgtgtagtatacgcttttcagttctacataattttgtttttcaaatcaagtttagca 
aatgaatctatcactggaaaatagggtagggtagccaagtggttaaagcggtcactgatcacgcc 
aaagacgagtgtcctaacctgcatgggtacaaaagtgaagaccattgctggtgtctaccgccgta 



• ••• • 

• • ••«• 

j^^^BL^^^^ •••• •••• ^^^^ 

ATATTGTTTTTAGTATTGCTAAAACTTATACTCACCCATGCGCTGTAAAAGTGGAATAATAATCA 
TATTTCAACAAAAGCACAAAACCATTTCATTTTCATGAAAGCCTCTTGTTCACCTGAAAGACGCA 
AGAGAACAATAGTTCCTAACATTATTTTCAGACATTGGAAATGTCCTGCACGTGTAAACCATATA 
TCCTTTGAAATTTTTACGACTGCATCGTATACAATTTATGATATAAATTTAAAACTTTAT 



3'-UTR 

TTCTTGGTCTCCACATATTCACATATCAGCACCAAATGGTTTCGAAGGACATTGGCGTTCTTCTC 
TGGCAATGCATTTCAATACAACATTGAAAATGACTTCAGCATATCAGTGTGCTTCGAACGTGTTC 
CGGAAGTACTCAAATGTGCTATGACTGAATTATTGTACATACATAACTTATTGATGTTCAATAAA 
TAAATGTTGAAACGAAAAAAAAAAAAAAAAAAAAAAA 




Aboeleitete Primarstruktur des HtH2 



FFLSHIGTSANVEIIIDHGTLHTSVGTFAVLGGEKEMKWGFDRLYKYEITDELRQLNLRADDVFS 
I SVKVTDVDGSELSSEL I PSAAI I FERSHIDHQDPHHDT 

IIRKlSrVDNLTPEEINSLRRAMAJDLQSDKTAGGFQQIAAFHGEPKWCPSPDA 

PHWHRLLTVQGENALRKHGCLGALPYWDWTRPLSHLPDLVLVSSRTTPMPYSTVEARNPWYSGHI 
DTVGVDTTRSVRQELYEAPGFGHYTGVAKQVLLALEQDDFCDFEVQFEIAHNFIHALVGGSEPYG 
MASLRYTTYDPIFYLHHSNTDRLWAIWQALQKYRGKPYNSANCAIASMRKPLQPFGLTDEINPDD 
ETRQHAVPFSVFDYKNNFNYEYDTLDFNGLSISQLDRELSRRKSHDRVFAGFLLHGIQQSALVKF 
FVCKSDDDCDHYAGEFYILGDEAEMPWGYDRLYKYEITEQLNALDLHIGDRFFIRYEAFDLHGTS 
LGSNI FPKPSVIHDEGAG 

HHQADEYDEVVTAASHIRKNLKDLSKGEVESLRSAFLQLQNDGVYENIAKFHGKPGLCDDNGRK^ 

•ACCVHGMPTFPQWHRLYVLQVENALLERGSAVSVPYWDWTETFTELPSLIAEATYFNSRQQTFDP 
NPFFRGKISFENAVTTRDPQPELYVNRYYYQISrVMLVFEQDNYCDFEIQFE^^^ 
YSISSLDYSAFDPVFFLHPIANTDRLWAIWQELQRYRKKPYNEADCAINLMRKPLHPFDNSDLNHD 
PVTFKYSKPTDGFDYQNNFGYKYDNLEFNHFSIPRLEEIIRIRQRQDRVFAGFLLHNIGTSATVE 
IFVCVPTTSGEQNCENKAGTFAVLGGETEMAFHFDRLYRFDISETLRDLGIQLDSHDFDLSIKIQ 
GVNGSYLDPHILPEPSLIFVPGSSSFLRPDG 

HSDDILVRKEVNSLTTRETASLIHALKSMQEDHSPDGFQAIASFHALPPLCPSPSAAHRYACCVH 
GMATFPQWHRLYTVQFQDALRRHGATVGVPYWDWLRPQSHLPELVTMETYHDIWSNRD^ 
ANI EFEGENI TTEREVI ADKL F VKGGHVFDNWF FKQAI LALEQENYCDFE I QFE ILHNGVHTWVG 
GSRTYSIGHLHYAFYDPLFYLHHSQTDRIWAIWQELQEQRGLSGDEAHCALEQMREPLKPFSFGA 
PYNWNQLTQDFSRPEDTFDYRKFGYEYDNLEFLGMSVAELDQYIIEHQENDRVFAGFLLSGFGGS 
ASVNFQVCRADSTCQDAGYFTVLGGSAEMAWAFDRLYKYDITETLEKMHLRYDDDFTISVSLTAN 
NGTVLSSSLIPTPSVIFQRG 

HRDINTRSMSPNRVRRELSDLSARDLSSLKSALRDLQEDDGPNGYQALAAFHGLPAGCHDSRGN'E 
I ACCIHGMPTFPQWHRL YTLQLEMALRRHGSS VAI P YWDWTKP I S ELPSLFTS PE YYDPWHDAW 

SNPFSKGFVKI^ANTYTVRDPQEMLFQLCEHGESILYEQTLLALEQTDYCDFEVQFEVLHNVIHYL 
pGRQTYALSSLHYASYDPFFFIHHSFVDKMWVVWQALQKRRKLPYKRADCAVNL 
MNQNPFTKMHAVPNTLYDYETLYYSYDNLEIGGRNLDQLQAEIDRSRSHDRVFAGFLLRGIGTS 
AD VRF W I CRNENDCHRGG 1 1 F I LGGAKEMP WS FDRNFKFD I THVLENAG ISP EDVFDAEE P F Y I K 
VEIHAVNKTMIPSSVIPAPTIIYSPGE 

GRAADSAHSANIAGSGVRKDVTTLTVSETENLRQALQGVIDDTGPNGYQAIASFHGSPPMCEMNG 
RKGACCAHGMASFPHWHRLYVKQMEDALADHGSHIGIPYWDWTTAFTELPALVTDSENWPFHEGR 
IDHLGVTTSRSPRDMLFNDPEQGSESFFYRQVLLALEQTDYCQFEVQFELTHNAIHSWTGGRSPY 
GMSTLEFTAYDPLFWLHHSNTDRIWAVWQALQKYRGLPYNEAHCEIQVLKQPLRPFNDDINHNPI 
TKTNARP I DS FDYERFNYQ YDTLS FHGKS I PELNDLLEERKREERTFAAFLLRG I GC SAD WFD I 
CRPNGDCVFAGTFAVLGGELEMPWSFDRLFRYDITRVMNQLHLQYDSDFSFRVKLVATNGTELSS 
DLLKSPTIEHELG 

AHRGPVEETEVTRQHTDGNAHFHRKEVDSLSLDEANl^KNALYKLQNDHSLTGYEAISGYHGYPN 
LCPEEGDDKIPCCVHGMGIFPYWHRLLTIQLERALEHNGALLGVPYWDWNKDLSSLPAFFSDSSN 
NNPYFKYHIAGVGHDTWEPTSLIYNQPQIHGYDYLYYLALTTLEElSnsrYCDFEVQYEILH^ 
WLGGSQKYSMSTLEYSAFDPVFMILHSGLDRLWIIWQELQKIRRKPYNFAKCAYHMMEEPLAPFS 
YPSINQDEFTRANSKPSTVFDQHKFGYHYDNLNVRGHSIQELNTIINDLRNTDRIYAGFVLSGIG 



TSASVKIYLRTDDNDEEVGTFTVLGGEREMPWAYERVFKYDITEVADRLKLSYGDTFNFRLEITS 

YDGSVVNK^LPNPFIIYRPANHDYDVLVIPVGRNLHIPPKWVKKGTRIEFHPVDDSV^ 

GSYTALFNCWPPFTYHGFELNHVYSVKPGDYYVTGPTRDLCQNADVRIHIHVEDE 



Domane KLH-1c 

TGGCATCGCTTCGCTACACTGCTTTTGATCCACTATTCTACTTGCATCACTCTAATACAGATCGT 
ATATGGGCAATATGGCAGGCTTTACAGAAGTACAGAGGAAAACCGTACAACGTTGCTAACTGTGC 
TGTTACATCGATGAGAGAACCTTTGCAACCATTTGGCCTCTCTGCCAATATCAACACAGACCATG 
TAACCAAGGAGCATTCAGTGCCATTCAACGTTTTTGATTACAAGACCAATTTCAATTATGAATAT 
GACACTTTGGAATTTAACGGTCTCTCAATCTCTCAGTTGAATAAAAAGCTCGAAGCGATAAAGAG 
CCAAGACAGGTTCTTTGCAGGCTTCCTGTTATCTGGTTTCAAGAAATCATCTCTTGTTAAATTCA 
ATATTTGCACCGATAGCAGCAACTGTCACCCCGCTGGAGAGTTTTACCTTCTGGGTGATGAAAAC 
GAGATGCCATGGGCATACGATAGAGTCTTCAAATATGACATAACCGAAAAACTCCACGATCTAAA 
GCTGCATGCAGAAGACCACTTCTACATTGACTATGAAGTATTTGACCTTAAACCAGCAAGCCTGG 
GAAAAGATTTGTTCAAGCAGCCTTCAGTCATTCATGAACCAAGAATAG 



ntron c/d 

GTACTTGTTATATGTTTCGAATATTGCCGATACCTTCAATATATATACTTTATCAAAGTAATTGA 
TTAATCTGAAGTAATTTTCCTTTCCAGTAGAGATTCAGTTGATACAACAAGAATTCGCCCTGTTG 
TATGTCACTTTATTTTCATCAAACGATTCGAAGTGAGCTGTCCATGCCACAATGGGGTCTCTGTA 
ACTTTCTCGTATGGGGTATAGATTATATAGACGTGGCAGACCTTACGTATAACTAATATTTGTGT 

AATGTCGTTTCAG 



Domane KLH-ld 

GTCACCATGAAGGCGAAGTATATCAAGGTGAAGTAACTTCTGCCAACGGTATTCGAAAAAACATT 
GAAAATCTGAGCCTTGGTGAACTCGAAAGTCTGAGAGCTGCCTTCCTGGAAATTGAAAACGATGG 
AACTTACGAATCAATAGCTAAATTCCATGGTAGCCCTGGTTTGTGCCAGTTAAATGGTAACCCCA 
TCTCTTGTTGTGTCCATGGCATGCCAACTTTCCCTCACTGGCACAGACTGTACGTGGTTGTCGTT 
GAGAATGCCCTCCTGAAAAAAGGATCATCTGTAGCTGTTCCCTATTGGGACTGGACAAAACGAAT 
CGAACATTTACCTCACCTGATTTCAGACGCCACTTACTACAATTCCAGGCAACATCACTATGAGA 

^aacccattccatcatggcaaaatcacacacgagaatgaaatcactactagggatcccaaggac 
Pgcctcttccattcagactacttttacgagcaggtcctttacgccttggagcaggataacttctg 
tgatttcgagattcagttggagatattacacaatgcattgcattctttacttggtggcaaaggta 
aatattccatgtcaaaccttgattacgctgcttttgatcctgtgttcttccttcatcacgcaacg 
actgacagaatctgggcaatctggcaagaccttcagaggttccgaaaacggccataccgagaagc 
gaattgcgctatccaattgatgcacacgccactccagccgtttgataagagcgacaacaatgacg 

AGGCAACGAAAACGCATGCCACTCCACATGATGGTTTTGAATATCAAAACAGCTTTGGTTATGCT 

tacgataatctggaactgaatcactactcgattcctcagcttgatcacatgctgcaagaaagaaa 
aaggcatgacagagtattcgctggcttcctccttcacaatattggaacatctgccgatggccatg 
tatttgtatgtctcccaactggggaacacacgaaggactgcagtcatgaggctggtatgttctcc 
atcttaggcggtcaaacggagatgtcctttgtatttgacagactttacaaacttgacataactaa 
agccttgaaaaagaacggtgtgcacctgcaaggggatttcgatctggaaattgagattacggctg 

TGAATGGATCTCATCTAGACAGTCATGTCATCCACTCTCCCACTATACTGTTTGAGGCCGGAACA 



mm 



m 



Intron d/e 



GTAACTATTTTGTCACTGTAACCAACAACTGCAGTCTATTTTGCAATTACGATAATAACAATTTT 
TGAAATATATCTTTATTAAAGCAAAGGTTTCTAGAGACAAACAGCCGGCTCTAATTATTTTTTCG 
AACTTACGCTTGAGTAAAGATCTGCAAATGGCAACCCTACCTATACTATTAAAAATATAATGTTA 
CATTCGTATCTGAATGTTTAATAAATCACTTCATATTCTGTTGCAG 



Domane KLH-1e 

ATTCTGCCCACACAGATGATGGACACACTGAACCAGTGATGATTCGCAAAGATATCACACAATTG 
GACAAGCGTCAACAACTGTCACTGGTGAAAGCCCTCGAGTCCATGAAAGCCGACCATTCATCTGA 
TGGGTTCCAGGCAATCGCTTCCTTCCATGCTCTTCCTCCTCTTTGTCCATCACCAGCTGCTTCAA 
AGAGGTTTGCGTGCTGCGTCCATGGCATGCCAACCTTCCCGCAATG 
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Domane KLH-2c 

CTGATGCCAAAGACTTTGGCCATAGCAGAAAAATCAGGAAAGACGTTGATTCTCTGACAGTCGAA 
GAACAAACTTCGTTGAGGCGAGCTATGGCAGATCTACAGGACGACAAAACATCAGGGGGTTTCCA 
GCAGATTGCAGCATTCCACGGAGAACCAAAATGGTGTCCAAGCCCCGAAGCGGAGAAAAAATTTG 
CATGCTGTGTTCATGGAATGGCTGTTTTCCCTCACTGGCACAGATTGCTGACAGTTCAAGGAGAA 
AATGCTCTGAGGAAACATGGCTTTACTGGTGGACTGCCTTACTGGGACTGGACA 




Figur 11 



Abaeleitete Primarstruktur von KLH2 



KLH-2b 

LRYTAFDPIFYLHHSNVDRLWAIWQALQIRRGKSYKAHCASSQEREPLKPFAFSSPLNNNEKTYH 

NSVPTNVYDYVGVLHYRYDDLQFGGMTMSELEEYIHKQTQHDRTFAGFFLSYIGTSASVDIFINR 

EGHDKYKVGSFV\n:,GGSKEMKWGFDRiynrKYEITEALKTLNVA\^ 

IPPPAIIFERGH 



KLH-2C 

ADAKDFGHSRKIRKDVDSLTVEEQTSLRRAMADLQDDKTSGGFQQIAAFHGEPKWCPSPEAEKKF 
ACCVHGMAVFPHWHRLLTVQGENALRKHGFTGGLPYWDWT 
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